2013-12-16 5 views
7

यहाँ कुछ डेटाआर में GLM साथ 95% विश्वास अंतराल (..) जाओ

dat = data.frame(y = c(9,7,7,7,5,6,4,6,3,5,1,5), x = c(1,1,2,2,3,3,4,4,5,5,6,6), color = rep(c('a','b'),6)) 

और इन आंकड़ों की साजिश आप चाहें

require(ggplot) 
ggplot(dat, aes(x=x,y=y, color=color)) + geom_point() + geom_smooth(method='lm') 

जब समारोह के साथ एक मॉडल चल रहा है, तो कर रहे हैं MCMCglmm() ...

require(MCMCglmm) 
summary(MCMCglmm(fixed = y~x/color, data=dat)) 

मैं अनुमान मुझे पता करने के लिए अनुमति के लिए लोअर और अपर 95% अंतराल मिलता है दो ढिलाई es (रंग = ए और रंग = बी) काफी अलग हैं।

जब यह उत्पादन को देख ...

summary(glm(y~x/color, data=dat)) 

... मैं विश्वास अंतराल नहीं देख सकते हैं!

मेरा प्रश्न है:

जब समारोह glm() का उपयोग कर मैं कैसे अनुमान के लिए इन लोअर और अपर 95% अंतराल विश्वास हो सकती है?

+0

** MASS ** पैकेज में एक 'confint' फ़ंक्शन है, मुझे विश्वास है। – joran

+0

... भी, आत्मविश्वास अंतराल की तुलना करके सांख्यिकीय महत्व का सावधानी बरतें। आप कुछ महत्वपूर्ण परिणाम याद कर सकते हैं। – joran

+0

इस मामले में, वे काम करते हैं: बस देखें कि "x: colorb" गुणांक ओवरलैप 0. –

उत्तर

8

उपयोग confint

 

mod = glm(y~x/color, data=dat) 
summary(mod) 
Call: 
glm(formula = y ~ x/color, data = dat) 

Deviance Residuals: 
    Min  1Q Median  3Q  Max 
-1.11722 -0.40952 -0.04908 0.32674 1.35531 

Coefficients: 
      Estimate Std. Error t value  Pr(>|t|) 
(Intercept) 8.8667  0.4782 18.540 0.0000000177 
x   -1.2220  0.1341 -9.113 0.0000077075 
x:colorb  0.4725  0.1077 4.387  0.00175 

(Dispersion parameter for gaussian family taken to be 0.5277981) 

    Null deviance: 48.9167 on 11 degrees of freedom 
Residual deviance: 4.7502 on 9 degrees of freedom 
AIC: 30.934 

Number of Fisher Scoring iterations: 2 

confint(mod) 
Waiting for profiling to be done... 
       2.5 %  97.5 % 
(Intercept) 7.9293355 9.8039978 
x   -1.4847882 -0.9591679 
x:colorb  0.2614333 0.6836217 
+0

कोई भी क्यों नहीं पूछ रहा है कि मुख्य प्रभाव के रूप में रंगीन को शामिल करने के लिए औचित्य है या नहीं? –

+0

@DWin मैं तुलना करना चाहता हूं कि 'रंग' के स्तर' y' पर 'x' के प्रभाव से कैसे इंटरैक्ट करते हैं। मैं ढलानों की तुलना में केवल रूचि रखता हूं। मुझे वास्तव में 'रंग' के समग्र प्रभाव की परवाह नहीं है। क्या यह एक अच्छा औचित्य की तरह लगता है? –

+1

मेरे लिए नहीं। जब तक आप सबूत नहीं देते कि अकेले रंग का कोई प्रभाव नहीं पड़ता है, तो आप शून्य मुख्य होने के लिए रंग मुख्य प्रभाव को बाधित करके एक बातचीत का अध्ययन करने के लिए अपनी शक्ति को _reducing_ कर रहे हैं। –

2

@ एलेक्स के दृष्टिकोण आप विश्वास सीमा मिलता है, लेकिन व्याख्या के बारे में सावधान रहना होगा। चूंकि ग्लैम मौलिक रूप से एक गैर-लाइनर मॉडल है, गुणांक आमतौर पर बड़े कॉन्वर्सिस होते हैं। आपको कम से कम 95% आत्मविश्वास अंडाकार देखना चाहिए।

mod <- glm(y~x/color, data=dat) 
require(ellipse) 
conf.ellipse <- data.frame(ellipse(mod,which=c(2,3))) 
ggplot(conf.ellipse, aes(x=x,y=x.colorb)) + 
    geom_path()+ 
    geom_point(x=mod$coefficient[2],y=mod$coefficient[3], size=5, color="red") 

यह उत्पादित करता है, जो एक्स और इंटरैक्शन अवधि के लिए 95% आत्मविश्वास अंडाकार है।

सूचना कैसे विश्वास confint(...) द्वारा उत्पादित सीमा दीर्घवृत्त के साथ अच्छी तरह से कर रहे हैं। उस अर्थ में, अंडाकार आत्मविश्वास सीमा का एक अधिक रूढ़िवादी अनुमान प्रदान करता है।

+0

अधिक रूढ़िवादी आत्मविश्वास सीमाओं के साथ आने के कई तरीके हैं। Ggplot पैकेज में उपयोग की जाने वाली विधियां क्या हैं? यह अस्पष्ट है। प्रोफ़ाइल सीमाओं में वास्तव में अच्छी संपत्तियां हैं और आपने जो कमी देखी है, उसके अधीन नहीं हैं। वे अक्सर गैर रेखीय मॉडल में उपयोग किया जाता है। चूंकि मूल मॉडल ने आईडी लिंक और गाऊशियन वितरण के साथ जीएलएम का उपयोग किया है, इसलिए "मौलिक गैर-रैखिकता" के बारे में चिंता करने की आवश्यकता नहीं है। –

+0

'ggplot' का उपयोग साजिश के लिए किया जाता है। 'अंडाकार (...)' एलिप्स पैकेज से आता है। साजिश से, यह स्पष्ट है कि 'x' और' x: colorb' दृढ़ता से सहसंबंधित हैं। – jlhoward

+0

गुणांक सहसंबंधित हैं, लेकिन मुझे समझ में नहीं आता कि यह परीक्षण के खिलाफ तर्क क्यों है कि एक गुणांक 0. –

संबंधित मुद्दे