आर

2012-10-12 5 views
6

में anova() के साथ दो रैखिक मॉडल की तुलना करना मुझे समझ में नहीं आता कि इस आउटपुट में पी-वैल्यू का क्या अर्थ है। मेरा मतलब पी-वैल्यू नहीं है, लेकिन इस मामले में।आर

> Model 1: sl ~ le + ky 
> Model 2: sl ~ le 
    Res.Df  RSS Df Sum of Sq  F Pr(>F) 
1  97 0.51113        
2  98 0.51211 -1 -0.00097796 0.1856 0.6676 

मैं ऐसा ही कुछ मिलता है, और अब मैं जो मॉडल सोच रहा हूँ बेहतर विकल्प है। जैसा कि केवल एक है और दो पी-मूल्य नहीं है, मैं उलझन में हूं। मैं अलग सारांश (MODEL1) या सारांश (MODEL2)

अभी सेवा का उपयोग pvalues ​​अगर

> fm2<-lm(Y~X+T) 

और

> fm4<-lm(Y~X) 

(टी मेरी सूचक चर जा रहा है), तो मुझे क्या करना

> anova(fm2,fm4) 

यह शून्य परिकल्पना H0: alpha1==alpha2परीक्षण करता है(Ha: alpha1!=alpha2) ग (अल्फा मेरी अवरोधन किया जा रहा है) तो यह परीक्षण किया जाता है कि क्या यह एक अंत: खंड (=>alpha1==alpha2) के लिए बेहतर है, या दो अवरोध (alpha1!=alpha2)

इस मामले अब हम स्पष्ट रूप से रिक्त परिकल्पना को अस्वीकार आरंभ करेगा, चूंकि पी-मान 0.6676 है।

इसका मतलब यह होगा कि हमें मॉडल fm4 मॉडल के साथ चिपकना चाहिए, क्योंकि यह हमारे डेटा के लिए अधिक उपयुक्त है।

क्या मैंने निष्कर्ष निकाला है? मैंने अपनी पूरी कोशिश की, लेकिन मुझे यकीन नहीं है कि पी-वैल्यू का क्या अर्थ है। जैसा कि केवल वही है, मैंने यही सोचा कि इसका मतलब हो सकता है। क्या कोई चीजों को साफ़ कर सकता है?

उत्तर

5

क्या आपका मतलब है " स्पष्ट रूप से शून्य परिकल्पना को अस्वीकार कर देगा" ("अब स्पष्ट रूप से अस्वीकार" के बजाय)? ऐसा लगता है कि आपके बाकी प्रश्नों को और अधिक समझ में आता है।

केवल एक पी-वैल्यू है क्योंकि तुलना करने के लिए दो मॉडल हैं, इसलिए एक तुलना (शून्य परिकल्पना बनाम वैकल्पिक, या वास्तव में इस मामले में शून्य परिकल्पना बनाम अनिर्दिष्ट विकल्प)। यह ऊपर बताए गए शब्दों से लगता है कि le एक निरंतर है और ky एक स्पष्ट भविष्यवाणी है, इस मामले में आप एक ढलान के साथ एक मॉडल की तुलना कर रहे हैं और एक जैसा ढलान (जैसा कि आपने कहा था) एक मॉडल के साथ एक ढलान और दो इंटरसेप्ट्स । चूंकि पी-मान अपेक्षाकृत बड़ा है, इसका मतलब है कि डेटा ky के एक additive प्रभाव के लिए साक्ष्य प्रदान नहीं करता है। सरल मॉडल आमतौर पर अधिक उपयुक्त होगा (हालांकि इस निष्कर्ष से सावधान रहें, क्योंकि पी-मानों का निर्माण परिकल्पनाओं का परीक्षण करने के लिए किया जाता है, मॉडल के बीच चयन नहीं किया जाता है)।

प्रत्येक व्यक्तिगत मॉडल के summary() के लिए आपको प्राप्त होने वाले पी-मान प्रत्येक मॉडल में प्रत्येक पैरामीटर के प्रभाव के लिए पी-मान हैं, जो उस मॉडल के सभी अन्य पैरामीटर पर सशर्त हैं। यदि आपका डेटा पूरी तरह संतुलित है (जो एक रिग्रेशन डिज़ाइन में असंभव है), तो आपको summary और anova से वही जवाब मिलना चाहिए, लेकिन अन्यथा anova के परिणाम आम तौर पर बेहतर होते हैं।

यह प्रश्न शायद http://stats.stackexchange.com के लिए अधिक उपयुक्त है, क्योंकि यह वास्तव में प्रोग्रामिंग के बजाय सांख्यिकीय व्याख्या के बारे में है ...