चेतावनी: गैर-पूर्णांक # एक द्विपक्षीय glm में विफलता! (सर्वेक्षण पैकेज)

मैं प्रोपेसिटी स्कोर बनाने के लिए twang पैकेज का उपयोग कर रहा हूं, जिसका उपयोग survey::svyglm का उपयोग करके एक द्विपदीय ग्लैम में वजन के रूप में किया जाता है।चेतावनी: गैर-पूर्णांक # एक द्विपक्षीय glm में विफलता! (सर्वेक्षण पैकेज)

pscore <- ps(ppci ~ var1+var2+.........., data=dt....) 

dt$w <- get.weights(pscore, stop.method="es.mean") 

design.ps <- svydesign(ids=~1, weights=~w, data=dt,) 

glm1 <- svyglm(m30 ~ ppci, design=design.ps,family=binomial)

यह निम्न चेतावनी का उत्पादन: कोड कुछ इस तरह दिखता

Warning message: 
    In eval(expr, envir, enclos) : non-integer #successes in a binomial glm!

किसी को भी पता है मैं गलत क्या कर रहा जा सकता है?

मुझे यकीन नहीं था कि यह संदेश आँकड़े पर बेहतर होगा। लेकिन, शेष राशि पर मैंने सोचा कि मैं पहले यहां कोशिश करूंगा।

स्रोत

2012-10-18 Robert Long

'm30'' प्रकार का चर क्या है? – James

@james, 'm30' बाइनरी –

वजन तब गैर-अभिन्न अंग होना चाहिए। एक द्विपक्षीय फिट परीक्षणों की एक अलग संख्या में सफलता की संभावना को खोजने की कोशिश करता है। – James

कुछ भी गलत नहीं है, glm केवल द्विपक्षीय (और पोइसन) मॉडल निर्दिष्ट करने की बात आती है। यह चेतावनी देता है कि क्या यह पता चलता है कि नहीं। परीक्षणों या सफलताओं का गैर-अभिन्न अंग है, लेकिन यह आगे बढ़ता है और मॉडल को वैसे भी फिट करता है। अगर आप चेतावनी को दबाना चाहते हैं (और आप सुनिश्चित हैं कि यह कोई समस्या नहीं है), तो इसके बजाय family=quasibinomial का उपयोग करें।

स्रोत

2012-10-18 12:00:53

दरअसल, और आईआईआरसी सभी एक जीएलएम को वास्तव में जानना आवश्यक है कि निर्दिष्ट अर्थ-भिन्नता संबंध है (जो कि 'अर्ध() 'परिवार क्या करते हैं/अनुमति देते हैं), वास्तविक डेटा का रूप वास्तव में कोई फर्क नहीं पड़ता। मुझे विश्वास है कि चेतावनी और अधिक नैनिंग है। –

हां, हालांकि मैंने कई मामलों को देखा है जहां लोगों ने देखा कि वे इस चेतावनी के कारण मूर्खतापूर्ण कुछ कर रहे थे ... –

@ बेनबॉकर आपकी टिप्पणी के लिए धन्यवाद। बेशक, मैंने सवाल पोस्ट करने का कारण यह है कि मुझे चिंता है कि मैं कुछ मूर्खतापूर्ण कर रहा हूं। –

गलत कुछ भी नहीं है, computationally, लेकिन सांख्यिकीय आप कुछ है कि ज्यादा समझ में आता है काम नहीं कर रही। ऐसे मामले में, संभवतः एक मजबूत प्रतिगमन विधि का उपयोग करना बेहतर होता है, जो आम तौर पर आनुपातिक प्रतिक्रिया डेटा के लिए एक अच्छा विचार है यदि आपके डेटा में बिल्कुल 1 या बिल्कुल 0 के साथ इकाइयां शामिल हैं।

स्रोत

2015-07-23 18:42:23 HaberdashPI

"... डेटा को फिट करने के लिए एक अलग विधि का भी उपयोग करता है" - यह गलत है। Quasibinomial और द्विपदीय परिवार _exactly_ समान संख्यात्मक विधि का उपयोग करते हैं, यानी उचित रूप से चुने हुए एमयू और ईटा के साथ आईआरएलएस। अंतर यह है कि क्वासिबिनोमियल 1) पूर्णांक जांच को दबाता है, और 2) एआईसी की रिपोर्ट नहीं करता है, क्योंकि यह तकनीकी रूप से अधिकतम संभावना-आधारित नहीं है। –

आप अपने आप को जांच सकते हैं कि क्वासिबिनोमियल द्विपदीय से अधिक मजबूत नहीं है, केवल 2 परिवारों के साथ यादृच्छिक डेटा और फिटिंग मॉडल उत्पन्न करके। आपको यह पता होना चाहिए कि डेटा की तरह क्या है या आप रैखिक रूप से अलग-अलग वर्गों के करीब कितने करीब हैं, मॉडल अनुमान बिल्कुल वही हैं। –

संपादन हांग ओओई के लिए धन्यवाद! ऐसा प्रतीत होता है कि मुझे स्टैक एक्सचेंज के क्रॉस-सत्यापन से इसी विषय पर एक और उत्तर से गलत जानकारी मिली थी। यह जानना बहुत अच्छा है!ऐसा प्रतीत नहीं होता है कि इस मामले में क्वासिबिनोमियल का उपयोग करना बहुत अच्छा तरीका है। – HaberdashPI

क्षमा करें, लेकिन यह अधिक मजबूत है यह समझ में आता है कि यदि अंतर्निहित तंत्र एक अतिव्यापी द्विपदीय मॉडल है, तो मानक एरोर का अनुमान लगाने पर अतिव्यापी द्विपदीय इसके लिए जिम्मेदार होगा। इसलिए, आपको बेहतर कवरेज मिलेगा, भले ही बिंदु अनुमान समान हों।

स्रोत

2017-06-01 19:09:32 user2809432

चेतावनी: गैर-पूर्णांक # एक द्विपक्षीय glm में विफलता! (सर्वेक्षण पैकेज)

उत्तर

संबंधित मुद्दे