में एक रेट वैरिएबल के लिए रिग्रेशन मुझे विभिन्न कार्यक्रमों में छात्र नामांकन देखने के लिए एक रिग्रेशन मॉडल विकसित करने के साथ काम सौंपा गया था। यह एक बहुत अच्छा, साफ डेटा सेट है जहां नामांकन गणना एक पोइसन वितरण अच्छी तरह से पालन करती है। मैं आर में एक मॉडल फिट करता हूं (जीएलएम और शून्य इन्फ्लेटेड पोइसन दोनों का उपयोग करके।) परिणामस्वरूप अवशिष्ट उचित लगते थे।आर
हालांकि, मुझे छात्रों की गिनती को "दर" में बदलने का निर्देश दिया गया था, जिसे छात्रों/स्कूल_पॉप्यूलेशन (प्रत्येक स्कूल की अपनी आबादी है) के रूप में गणना की गई थी।) यह अब एक गणना चर नहीं है, लेकिन अनुपात 0 और 1 के बीच। इसे एक कार्यक्रम में "नामांकन का अनुपात" माना जाता है।
यह "दर" (छात्र/आबादी) अब पोइसन नहीं है, लेकिन निश्चित रूप से सामान्य नहीं है। इसलिए, मैं उचित वितरण के रूप में थोड़ा सा खो गया हूं, और इसके बाद के मॉडल का प्रतिनिधित्व करने के लिए।
एक लॉग सामान्य वितरण इस दर पैरामीटर को अच्छी तरह फिट करने लगता है, हालांकि मेरे पास कई 0 मान हैं, इसलिए यह वास्तव में फिट नहीं होगा।
इस नए पैरामीटर के लिए वितरण के सर्वोत्तम रूप पर कोई सुझाव, और आर में इसका मॉडल कैसे करें?
धन्यवाद!
मुझे लगता है कि यह एक्सपोजर/ऑफसेट चर (http://en.wikipedia.org/wiki/Poisson_regression#.22Exposure.22_and_offset) का उपयोग करने का एक मामला है। और, शायद, http://stats.stackexchange.com/ – Rcoster
पर एक प्रश्न आर-सहायता के लिए क्रॉस-पोस्ट किया गया: http://thread.gmane.org/gmane.comp.lang.r.general/291112 –