मैं एक डाटासेट जिसमें डेटा कई समूहों (क्षेत्रों में शहरों) में क्लस्टर है का विश्लेषण करने कर रहा हूँ का उपयोग करना। डाटासेट लगता है:predict.lm में क्लस्टर सहप्रसरण मैट्रिक्स()
R> df <- data.frame(x = rnorm(10),
y = 3*rnorm(x),
groups = factor(sample(c('0','1'), 10, TRUE)))
R> head(df)
x y groups
1 -0.8959 1.54 1
2 -0.1008 -2.73 1
3 0.4406 0.44 0
4 0.0683 1.62 1
5 -0.0037 -0.20 1
6 -0.8966 -2.34 0
मैं चाहता हूँ मेरी एलएम() समूहों में intraclass सहसंबंध के लिए खाते का अनुमान है और उस उद्देश्य के लिए मैं एक समारोह cl()
कि एक lm()
लेता है और मजबूत क्लस्टर सहप्रसरण मैट्रिक्स रिटर्न (मूल here उपयोग कर रहा हूँ):
cl <- function(fm, cluster) {
library(sandwich)
M <- length(unique(cluster))
N <- length(cluster)
K <- fm$rank
dfc <- (M/(M-1))*((N-1)/(N-K-1))
uj <- apply(estfun(fm), 2, function(x) tapply(x, cluster, sum));
vcovCL <- dfc * sandwich(fm, meat = crossprod(uj)/N)
return(vcovCL)
}
अब,
output <- lm(y ~ x, data = df)
clcov <- cl(output, df$groups)
coeftest(output, clcov, nrow(df) - 1)
मुझे अनुमान मैं की जरूरत है देता है। समस्या अब है कि मैं भविष्यवाणी के लिए मॉडल का उपयोग करना चाहते हैं, और मैं भविष्यवाणी की मानक त्रुटि नई सहप्रसरण मैट्रिक्स clcov
के साथ गणना की जानी चाहिए। जो है, मैं
predict(output, se.fit = TRUE)
की जरूरत है लेकिन vcov(output)
के बजाय clcov
का उपयोग कर। vcov() <-
की तरह कुछ सही होगा।
बेशक, मैं भविष्यवाणियों के लिए अपना खुद का कार्य लिख सकता हूं, लेकिन मैं सोच रहा हूं कि एक और व्यावहारिक विधि है जो मुझे lm
(जैसे arm :: sim) के लिए विधियों का उपयोग करने की अनुमति देती है।
में परिणाम आपको थोड़ा और निर्दिष्ट करने की आवश्यकता है। उस क्लस्टर फ़ंक्शन से शुरू करने के लिए क्या है? एलएम() मान्य होने से मानक त्रुटियां क्यों आ रही हैं? मैं वास्तव में आप जो करने की कोशिश कर रहा हूं उसका पालन नहीं कर सकता। यह बहुत अच्छी तरह से हो सकता है कि आपको अधिक सामान्यीकृत मॉडल की आवश्यकता हो, जैसे ग्लैम, ग्लैम या गैम/गैम। साधारण एलएम कार्यों की मानक त्रुटियों पर करने के लिए बहुत कम बाएं है, जब तक कि आप उन्हें पूरी तरह से अलग संदर्भ में उपयोग न करें। लेकिन तब हम संदर्भ ... –
@Joris मैं प्रश्न संपादित किया है की जरूरत है। उम्मीद है कि यह अब स्पष्ट है। कृपया ध्यान दें कि मैं स्पष्ट रूप से 'ग्लम्म' मॉडल से परहेज कर रहा हूं। – griverorz