2010-12-02 6 views
10

मैंने अपने अलग डेटा पर नकारात्मक द्विपदीय वितरण को फिट करने के लिए मॉडल फिटिंग का उपयोग किया। एक अंतिम चरण के रूप में ऐसा लगता है कि मॉडल को डेटा को अच्छी तरह फिट करने के लिए मुझे कोल्मोग्रोव-स्मरनोव परीक्षण करने की आवश्यकता है। सभी संदर्भ मैं सामान्य रूप सेनिरंतर डेटा वितरित के लिए परीक्षण का उपयोग कर के बारे में बात कर सका। क्या कोई मुझे बता सकता है कि यह आर में डेटा के लिए किया जा सकता है जो आम तौर पर वितरित और अलग नहीं होता है?कोल्मोगोरोव-स्मरनोव या ची-स्क्वायर परीक्षण?

तो मैंने पाया vcd पैकेज एक समारोह goodfit कि हो सकता है जिसमें:

अद्यतन (यहां तक ​​कि एक ची-वर्ग परीक्षण मेरा अनुमान है कि क्या करना चाहिए लेकिन कृपया मुझे ठीक कर लें मैं गलत हूँ।)

library(vcd) 

# Define the data 
data <- c(67, 81, 93, 65, 18, 44, 31, 103, 64, 19, 27, 57, 63, 25, 22, 150, 
      31, 58, 93, 6, 86, 43, 17, 9, 78, 23, 75, 28, 37, 23, 108, 14, 137, 
      69, 58, 81, 62, 25, 54, 57, 65, 72, 17, 22, 170, 95, 38, 33, 34, 68, 
      38, 117, 28, 17, 19, 25, 24, 15, 103, 31, 33, 77, 38, 8, 48, 32, 48, 
      26, 63, 16, 70, 87, 31, 36, 31, 38, 91, 117, 16, 40, 7, 26, 15, 89, 
      67, 7, 39, 33, 58) 

gf <- goodfit(data, type = "nbinomial", method = "MinChisq") 
plot(gf) 

लेकिन gf <- ... कदम के बाद, आर कह शिकायत: निम्नलिखित तरीके से इस उद्देश्य के लिए इस्तेमाल

Warning messages: 
1: In pnbinom(q, size, prob, lower.tail, log.p) : NaNs produced 
2: In pnbinom(q, size, prob, lower.tail, log.p) : NaNs produced 
3: In pnbinom(q, size, prob, lower.tail, log.p) : NaNs produced 

और जब मैं plot कहते हैं कि यह शिकायत:

data <- <- rnbinom(200, size = 1.5, prob = 0.8) 

सब कुछ ठीक काम करता है:

Error in xy.coords(x, y, xlabel, ylabel, log) : 
    'x' is a list, but does not have components 'x' and 'y' 

मुझे यकीन है कि क्या हो रहा है, क्योंकि अगर मैं data सेट निम्नलिखित होने के लिए नहीं कर रहा हूँ। कोई सुझाव?

+6

http://stats.stackexchange.com/ – MSalters

+0

प्लॉट (जीएफ) पर काम करता है (आर 2.12.0, वीसीडी का संस्करण 1.2-9)। चेतावनियों को त्रुटियों में बदलने के लिए विकल्प (चेतावनी = 2, त्रुटि = पुनर्प्राप्ति) का उपयोग करें और फिर चेतावनी/त्रुटि पर एक ब्राउज़र प्रारंभ करें। फिटिंग प्रक्रिया में किसी बिंदु पर आर एनबी 'प्रोब' पैरामीटर नकारात्मक बनाने की कोशिश कर रहा है ... f <- MASS :: fitdistr (डेटा, "नकारात्मक द्विपक्षीय"); साजिश (तालिका (डेटा)/लंबाई (डेटा)); वक्र (dnbinom (x, आकार = 2.354, mu = 50.8), = 1, से = 170, एन = 170, जोड़ें = TRUE, col = 2) इंगित करता है कि डेटा एनबी अच्छी तरह फिट करने के लिए भी 'पैची' है। इन दो मामलों में $ par की तुलना से पता चलता है कि आप उचित उत्तर पर पहुंचते हैं; चेतावनियां शायद अनजान हैं –

उत्तर

6

एक केएस-टेस्ट केवल निरंतर चर के लिए है, साथ ही आपको उस वितरण को पूरी तरह निर्दिष्ट करना होगा जिसके खिलाफ आप परीक्षण कर रहे हैं। आप अभी भी इसे करना चाहता था, तो यह इस प्रकार दिखाई देगा:

ks.test(data, pnbinom, size=100, prob=0.8) 

यह निर्दिष्ट एक के खिलाफ data के अनुभवजन्य संचयी बंटन फ़ंक्शन तुलना (जो समझ में आता है कि क्या शायद अपने डेटा पर निर्भर करता है)। आपको सैद्धांतिक विचारों के आधार पर size और prob के लिए पैरामीटर चुनना होगा, यदि डेटा के आधार पर आप उन मानकों का अनुमान लगाते हैं तो परीक्षण मान्य नहीं है।

goodfit() के साथ आपकी समस्या आपके डेटा के साथ हो सकती है, क्या आप वाकई इन मायने रखती हैं? barplot(table(data)) ऐसा लगता है कि यह लगभग नकारात्मक द्विपक्षीय वितरण का पालन नहीं करता है, उदाहरण के साथ, barplot(table(rnbinom(200, size = 1.5, prob = 0.8)))

अंत में, मुझे यकीन नहीं है कि फिटिंग के बाद शून्य-परिकल्पना परीक्षण करने का दृष्टिकोण उचित है या नहीं। आप $ \ chi^2 $ के बाहर/मात्रात्मक फिट उपायों को देखना चाहते हैं जिनमें से कई (आरएमएसईए, एसआरएमआर, ...) हैं।

संबंधित मुद्दे