2012-10-18 10 views
24

मैं प्रोपेसिटी स्कोर बनाने के लिए twang पैकेज का उपयोग कर रहा हूं, जिसका उपयोग survey::svyglm का उपयोग करके एक द्विपदीय ग्लैम में वजन के रूप में किया जाता है।चेतावनी: गैर-पूर्णांक # एक द्विपक्षीय glm में विफलता! (सर्वेक्षण पैकेज)

pscore <- ps(ppci ~ var1+var2+.........., data=dt....) 

dt$w <- get.weights(pscore, stop.method="es.mean") 

design.ps <- svydesign(ids=~1, weights=~w, data=dt,) 

glm1 <- svyglm(m30 ~ ppci, design=design.ps,family=binomial) 

यह निम्न चेतावनी का उत्पादन: कोड कुछ इस तरह दिखता

Warning message: 
    In eval(expr, envir, enclos) : non-integer #successes in a binomial glm! 

किसी को भी पता है मैं गलत क्या कर रहा जा सकता है?

मुझे यकीन नहीं था कि यह संदेश आँकड़े पर बेहतर होगा। लेकिन, शेष राशि पर मैंने सोचा कि मैं पहले यहां कोशिश करूंगा।

+0

'm30'' प्रकार का चर क्या है? – James

+0

@james, 'm30' बाइनरी –

+0

वजन तब गैर-अभिन्न अंग होना चाहिए। एक द्विपक्षीय फिट परीक्षणों की एक अलग संख्या में सफलता की संभावना को खोजने की कोशिश करता है। – James

उत्तर

38

कुछ भी गलत नहीं है, glm केवल द्विपक्षीय (और पोइसन) मॉडल निर्दिष्ट करने की बात आती है। यह चेतावनी देता है कि क्या यह पता चलता है कि नहीं। परीक्षणों या सफलताओं का गैर-अभिन्न अंग है, लेकिन यह आगे बढ़ता है और मॉडल को वैसे भी फिट करता है। अगर आप चेतावनी को दबाना चाहते हैं (और आप सुनिश्चित हैं कि यह कोई समस्या नहीं है), तो इसके बजाय family=quasibinomial का उपयोग करें।

+0

दरअसल, और आईआईआरसी सभी एक जीएलएम को वास्तव में जानना आवश्यक है कि निर्दिष्ट अर्थ-भिन्नता संबंध है (जो कि 'अर्ध() 'परिवार क्या करते हैं/अनुमति देते हैं), वास्तविक डेटा का रूप वास्तव में कोई फर्क नहीं पड़ता। मुझे विश्वास है कि चेतावनी और अधिक नैनिंग है। –

+4

हां, हालांकि मैंने कई मामलों को देखा है जहां लोगों ने देखा कि वे इस चेतावनी के कारण मूर्खतापूर्ण कुछ कर रहे थे ... –

+1

@ बेनबॉकर आपकी टिप्पणी के लिए धन्यवाद। बेशक, मैंने सवाल पोस्ट करने का कारण यह है कि मुझे चिंता है कि मैं कुछ मूर्खतापूर्ण कर रहा हूं। –

4

गलत कुछ भी नहीं है, computationally, लेकिन सांख्यिकीय आप कुछ है कि ज्यादा समझ में आता है काम नहीं कर रही। ऐसे मामले में, संभवतः एक मजबूत प्रतिगमन विधि का उपयोग करना बेहतर होता है, जो आम तौर पर आनुपातिक प्रतिक्रिया डेटा के लिए एक अच्छा विचार है यदि आपके डेटा में बिल्कुल 1 या बिल्कुल 0 के साथ इकाइयां शामिल हैं।

+0

"... डेटा को फिट करने के लिए एक अलग विधि का भी उपयोग करता है" - यह गलत है। Quasibinomial और द्विपदीय परिवार _exactly_ समान संख्यात्मक विधि का उपयोग करते हैं, यानी उचित रूप से चुने हुए एमयू और ईटा के साथ आईआरएलएस। अंतर यह है कि क्वासिबिनोमियल 1) पूर्णांक जांच को दबाता है, और 2) एआईसी की रिपोर्ट नहीं करता है, क्योंकि यह तकनीकी रूप से अधिकतम संभावना-आधारित नहीं है। –

+1

आप अपने आप को जांच सकते हैं कि क्वासिबिनोमियल द्विपदीय से अधिक मजबूत नहीं है, केवल 2 परिवारों के साथ यादृच्छिक डेटा और फिटिंग मॉडल उत्पन्न करके। आपको यह पता होना चाहिए कि डेटा की तरह क्या है या आप रैखिक रूप से अलग-अलग वर्गों के करीब कितने करीब हैं, मॉडल अनुमान बिल्कुल वही हैं। –

+0

संपादन हांग ओओई के लिए धन्यवाद! ऐसा प्रतीत होता है कि मुझे स्टैक एक्सचेंज के क्रॉस-सत्यापन से इसी विषय पर एक और उत्तर से गलत जानकारी मिली थी। यह जानना बहुत अच्छा है!ऐसा प्रतीत नहीं होता है कि इस मामले में क्वासिबिनोमियल का उपयोग करना बहुत अच्छा तरीका है। – HaberdashPI

0

क्षमा करें, लेकिन यह अधिक मजबूत है यह समझ में आता है कि यदि अंतर्निहित तंत्र एक अतिव्यापी द्विपदीय मॉडल है, तो मानक एरोर का अनुमान लगाने पर अतिव्यापी द्विपदीय इसके लिए जिम्मेदार होगा। इसलिए, आपको बेहतर कवरेज मिलेगा, भले ही बिंदु अनुमान समान हों।

संबंधित मुद्दे