2016-08-31 16 views
7

साजिश बनाम साजिश के लिए plot.lm() निर्धारित करता है कि कौन से बिंदु बाह्यरेखा (यानी, लेबल करने के लिए क्या अंक हैं)? केवल एक चीज मैं documentation में पाया यह है:plot.lm() अवशिष्ट बनाम प्लॉट प्लॉट के लिए आउटलेटर्स कैसे निर्धारित करता है?

विवरण

डिफ़ॉल्ट sub.caption-से समारोह कॉल-है एक उपशीर्षक के रूप में (एक्स-अक्ष शीर्षक के अंतर्गत) प्रत्येक भूखंड पर दिखाया जब अलग-अलग पृष्ठों पर प्लॉट होते हैं, या बाहरी मार्जिन (यदि कोई हो) में उपशीर्षक के रूप में प्रति पृष्ठ एकाधिक प्लॉट होते हैं।

'स्केल-लोकेशन' प्लॉट जिसे 'स्प्रेड-लोकेशन' या 'एस-एल' प्लॉट भी कहा जाता है, स्क्व्यूनेस (एसकर्ट (| ई |)) को कम करने के लिए पूर्ण अवशेषों का वर्ग रूट लेता है से कम skewed | ई | गॉसियन शून्य-माध्य ई के लिए)।

'एस-एल', क्यू-क्यू, और अवशिष्ट-लीवरेज प्लॉट, मानकीकृत अवशेषों का उपयोग करें जिनमें समान भिन्नता (परिकल्पना के तहत) है। उन्हें आर [i]/(s * sqrt (1 - h.ii) के रूप में दिया जाता है) जहां h.ii टोपी मैट्रिक्स की विकर्ण प्रविष्टियां हैं, प्रभाव() $ टोपी (टोपी भी देखें), और जहां अवशिष्ट- लीवरेज प्लॉट मानकीकृत पियरसन अवशेषों का उपयोग करता है (residuals.glm (type = "pearson")) आर [i] के लिए।

अवशिष्ट-लीवरेज प्लॉट cook.levels के मूल्यों के लिए बराबर कुक की दूरी के रूप में दिखाता है (डिफ़ॉल्ट 0.5 और 1 तक) और चेतावनी के साथ लीवरेज के साथ मामलों को छोड़ देता है। यदि लीवरेज स्थिर हैं (जैसा आमतौर पर संतुलित एओवी स्थिति में होता है) प्लॉट एक्स-अक्ष के लिए लीवरेज के बजाय कारक स्तर संयोजन का उपयोग करता है। (कारक स्तर का मतलब औसत फिट मूल्य से किया जाता है।)

कुक की दूरी बनाम लीवरेज/(1-लीवरेज) साजिश में, मानकीकृत अवशेषों के समरूप जो कि परिमाण के बराबर हैं, मूल के माध्यम से रेखाएं हैं। समोच्च रेखाओं को परिमाण के साथ लेबल किया जाता है।

लेकिन यह कुछ भी नहीं कहता है कि कैसे बनाम बनाम बनाम साजिश उत्पन्न हुई थी और यह किस बिंदु को लेबल करने का विकल्प चुनती है।

अद्यतन: Zheyuan ली के उत्तर से पता चलता है कि शेष अवशिष्ट बनाम प्लॉट लेबल के तरीके सबसे बड़े अवशेषों के साथ 3 अंक देखकर वास्तव में है। वास्तव में यही मामला है। इसे निम्नलिखित "चरम" उदाहरण द्वारा प्रदर्शित किया जा सकता है।

x = c(1,2,3,4,5,6) 
y = c(2,4,6,8,10,12) 
foo = data.frame(x,y) 
model = lm(y ~ x, data = foo) 

enter image description here

+0

@ZheyuanLi धन्यवाद। मैंने देखा कि दस्तावेज़ीकरण में और मैं सोच रहा था कि हमारे पास 'id.n = ALL' जैसे विकल्प क्यों नहीं हैं। यह अब समझ में आता है। – 3x89g2

उत्तर

12

वे सबसे बड़ा 3 निरपेक्ष मानकीकृत बच खोजें। इस उदाहरण पर विचार:

fit <- lm(dist ~ speed, cars) 
plot(fit, which = 1) 

enter image description here

r <- rstandard(fit) ## get standardised residuals 
order(abs(r), decreasing = TRUE)[1:3] 
# [1] 49 23 35 
संबंधित मुद्दे