2015-05-31 4 views
6

मैं statsmodels.regression.linear_model.RegressionResults की एपीआई की खुदाई कर रहे हैं और (, HC0_se की तरह गुण के माध्यम से आदि) पाया है heteroskedasticity के विभिन्न जायके मानक त्रुटियाँ ठीक पुनः प्राप्त करने के लिए कैसे हालांकि सही है, मैं इस सटीक मानक त्रुटियों का उपयोग करने के लिए गुणांक पर टी -tests प्राप्त करने के बारे में काफी जानकारी नहीं दे सकता। क्या एपीआई में ऐसा करने का कोई तरीका है, या क्या मुझे इसे मैन्युअल रूप से करना है? यदि उत्तरार्द्ध, क्या आप आंकड़े मॉडल परिणामों के साथ ऐसा करने के तरीके पर कोई मार्गदर्शन सुझा सकते हैं?हो रही heteroskedasticity उपयोग करने के लिए statsmodels गुणांक टी परीक्षणों में मानक त्रुटियों

उत्तर

10

रैखिक मॉडल, अलग मॉडल और जीएलएम की fit विधि, cov_type और cov_kwds मजबूत कॉन्वर्सिस मैट्रिस निर्दिष्ट करने के लिए तर्क लें। यह परिणाम उदाहरण से जुड़ा होगा और सारांश तालिका में रिपोर्ट की गई सभी अनुमान और आंकड़ों के लिए उपयोग किया जाएगा।

दुर्भाग्यवश, दस्तावेज वास्तव में इसे उचित तरीके से नहीं दिखाता है। http://statsmodels.sourceforge.net/devel/generated/statsmodels.regression.linear_model.OLS.fit.html

उदाहरण के लिए, एक OLS मॉडल का आकलन और HC3 सहप्रसरण मैट्रिक्स का उपयोग कर के साथ

model_ols = OLS(...) 
result = model_ols.fit(cov_type='HC3') 
result.bse 
result.t_test(....) 

कुछ किया जा सकता है: सहायक विधि है कि वास्तव में विकल्पों के आधार पर सैंडविच का चयन करता है विकल्प और आवश्यक तर्क से पता चलता

results = OLS(...).fit(cov_type='cluster', cov_kwds={'groups': mygroups} 
results.bse 
... 
: सैंडविच अतिरिक्त तर्क की आवश्यकता है, उदाहरण के क्लस्टर मजबूत मानक त्रुटियों के लिए, निम्नलिखित तरीके से चुना जा सकता है, mygroups संभालने एक सरणी है कि समूहों लेबल होते है

कुछ मजबूत कॉन्वर्सिस मैट्रिस बिना जांच किए डेटा के बारे में अतिरिक्त धारणाएं करते हैं। उदाहरण के लिए हेटरोसेस्डैक्टीटी और ऑटोकोरेशन मजबूत मानक त्रुटियां या न्यूई-वेस्ट, HAC, मानक त्रुटियां अनुक्रमिक समय श्रृंखला संरचना मानती हैं। कुछ पैनल डेटा मजबूत मानक त्रुटियां भी व्यक्तियों द्वारा समय श्रृंखला के ढेर को मानती हैं।

एक अलग विकल्प use_t यह निर्दिष्ट करने के लिए उपलब्ध है कि टी और एफ या सामान्य और चिस्क्वायर वितरण डिफ़ॉल्ट रूप से वाल्ड परीक्षण और आत्मविश्वास अंतराल के लिए उपयोग किए जाने चाहिए या नहीं।

+1

धन्यवाद! मुझे उम्मीद है कि यह जल्द ही दस्तावेज़ों में बना देगा। –

+0

आपको दोबारा परेशान करने के लिए खेद है, लेकिन 'परिणाम * बीएसई' के लिए 'एचसी *' से मजबूत अवशेषों के लिए आवश्यक है, जो * टी * -टेस्ट में उपयोग किया जा सकता है, और 'result.resid' में दिखाई देने के लिए? या 'model_ols.fit है (cov_type =' एचसी 3 ')' मुझे बस इतना चाहिए? –

+1

नहीं, आपको 'फिट' के बाद कुछ और कॉल करने की आवश्यकता नहीं है। 'बीएसई 'और' t_test' केवल दो उदाहरण थे जहां निर्दिष्ट 'cov_type' का उपयोग किया जाता है। मजबूत सैंडविच कॉन्वर्सिस को 'cov_params_default' में संग्रहीत किया जाता है और हर जगह उपयोग किया जाता है जहां हमें पैरामीटर अनुमानों की कॉन्वर्सिस की आवश्यकता होती है। इसे सत्यापित करने का एक आसान तरीका अलग-अलग 'cov_types' के साथ दो परिणाम उदाहरण बनाना है और जांचें कि कॉन्वर्सिस मैट्रिक्स पर निर्भर परिणाम अलग हैं, उदा। सारांश में() '। – user333700

संबंधित मुद्दे