2010-03-19 8 views
11

मानक आँकड़े :: पर विवरण के साथ Kruskal वालिस परीक्षण kruskal.test मॉड्यूल एक डाटासेट पर Kruskal वालिस परीक्षण गणना कर सकता है कि डेटा के सभी समूहों का एक ही मतलब है।जोड़ो में तुलना

हालांकि, मैं प्रत्येक जोड़ी तुलना के लिए विवरण प्राप्त करना चाहता हूं, जैसे रंगों के हीरे डी और ई के समान मूल्य हैं, क्योंकि कुछ अन्य सॉफ्टवेयर (एसपीएसएस) जब आप क्रस्कल परीक्षण के लिए पूछते हैं।

मैं पैकेज pgirmess जो मुझे कि मैं क्या करना चाहते करने की अनुमति देता से kruskalmc पाया है:

> kruskalmc(diamonds$price, diamonds$color) 
Multiple comparison test after Kruskal-Wallis 
p.value: 0.05 
Comparisons 
     obs.dif critical.dif difference 
D-E 571.7459  747.4962  FALSE 
D-F 2237.4309  751.5684  TRUE 
D-G 2643.1778  726.9854  TRUE 
D-H 4539.4392  774.4809  TRUE 
D-I 6002.6286  862.0150  TRUE 
D-J 8077.2871 1061.7451  TRUE 
E-F 2809.1767  680.4144  TRUE 
E-G 3214.9237  653.1587  TRUE 
E-H 5111.1851  705.6410  TRUE 
E-I 6574.3744  800.7362  TRUE 
E-J 8649.0330 1012.6260  TRUE 
F-G 405.7470  657.8152  FALSE 
F-H 2302.0083  709.9533  TRUE 
F-I 3765.1977  804.5390  TRUE 
F-J 5839.8562 1015.6357  TRUE 
G-H 1896.2614  683.8760  TRUE 
G-I 3359.4507  781.6237  TRUE 
G-J 5434.1093  997.5813  TRUE 
H-I 1463.1894  825.9834  TRUE 
H-J 3537.8479 1032.7058  TRUE 
I-J 2074.6585 1099.8776  TRUE 

हालांकि, इस पैकेज केवल एक categoric चर के लिए अनुमति देता है (उदाहरण के लिए मैं कीमतों क्लस्टर का अध्ययन नहीं कर सकते रंग और कैरेट द्वारा, जैसा कि मैं kruskal.test के साथ कर सकता हूं), और मुझे pgirmess पैकेज के बारे में कुछ भी पता नहीं है, चाहे वह बनाए रखा गया हो या नहीं, या यदि इसका परीक्षण किया जाता है।

क्या आप मुझे कृष्काल-वालिस परीक्षण निष्पादित करने के लिए एक पैकेज की सिफारिश कर सकते हैं जो हर तुलना के लिए विवरण देता है? आप समस्या को कैसे संभालेंगे?

+0

'agricolae' पैकेज में' kruskal' समारोह है। आप जांच सकते हैं कि आपकी जरूरतों के अनुरूप है या नहीं। – Marek

+1

जाहिर है आप kruskal.test (दूसरे .test के बिना) मतलब है। मुझे लगता है कि आप ggplot2 पैकेज से हीरे डेटासेट का उपयोग कर रहे हैं। खैर, मैं यह नहीं समझ सकता कि क्यों, लेकिन जब मैं इसे लोड करने का प्रयास करता हूं तो मुझे त्रुटि मिलती है 'R_decompress1 में आंतरिक त्रुटि -3 इसके अतिरिक्त: चेतावनी संदेश: बाधित वादा मूल्यांकन को पुनरारंभ करना। (मुझे पता है, यह एक प्रश्न जैसा दिखता है मुझे पोस्ट करना चाहिए, लेकिन क्या किसी को भी एक ही समस्या का सामना करना पड़ा है?) –

+0

@ मरेक: बहुत बहुत धन्यवाद। मैंने कृषि देखा लेकिन ऐसा लगता है कि यह समान समस्या है :-( @ gd047: मुझे नहीं पता कि आपकी त्रुटि क्या हो सकती है, वास्तव में। शायद आपको ggplot2 को पुनर्स्थापित करने का प्रयास करना चाहिए। क्या आपके पास अन्य डेटासेट्स के साथ एक ही त्रुटि है या पैकेज? – dalloliogm

उत्तर

16

मरेक द्वारा वर्णित कुर्स्कल :: कृषि के अलावा एक अन्य दृष्टिकोण, मोनकंप का उपयोग करने वाले सिक्के पैकेज में oneway_test के लिए सहायता पृष्ठ में कार्यान्वित निमेनी-डेमिको-वोल्फ-डन परीक्षण है। हैडली का सेटअप का उपयोग करते हुए और लगभग() फ़ंक्शन के लिए बी = मूल्य को कम करने तो यह सीमित समय में खत्म:

#updated translation of help page implementation of NDWD 
NDWD <- 
    independence_test(dv ~ iv, data = sum_codings1, distribution = approximate(B = 10000), 
          ytrafo = function(data) trafo(data, numeric_trafo = rank_trafo), 
          xtrafo = mcp_trafo(iv = "Tukey")) 


    ### global p-value 
    print(pvalue(NDWD)) 

    ### sites (I = II) != (III = IV) at alpha = 0.01 (page 244) 
    print(pvalue(NDWD, method = "single-step")) 

कि बड़े डेटासेट पर अधिक स्थिर परिणामों बी मूल्य में वृद्धि और उपयोगकर्ता के धैर्य में वृद्धि की आवश्यकता हो सकती।

जनवरी: 2012: हाल ही में इस विधि से अप्रत्याशित परिणामों का दावा करने में आर-सहायता पर एक पोस्टिंग हुई थी, इसलिए मैंने उस ईमेल को रखरखाव को अग्रेषित कर दिया।मार्क Difford ने कहा कि वह समस्याओं की पुष्टि की थी और nparcomp पैकेज के साथ एक वैकल्पिक परीक्षण की पेशकश की: https://stat.ethz.ch/pipermail/r-help/2012-January/300100.html

वहाँ एक ही सप्ताह बाद हॉक के लिए rhelp पर अन्य सुझावों की एक जोड़ी किलोवाट परीक्षण करने के लिए विरोधाभासों में भी थे: kruskalmc suggested by Mario Garrido Escudero और rms::polrrms::contrasts के बाद फ्रैंक Harrell https://stat.ethz.ch/pipermail/r-help/2012-January/300329.html

नवंबर 2015 तक का सुझाव दिया: toto_tico कि मदद सिक्का पैकेज के पेज कोड बीच के वर्षों में बदल दिया गया है के साथ सहमत हूँ। ?independence_test सहायता पृष्ठ अब एक बहुविकल्पीय-केडब्ल्यू परीक्षण प्रदान करता है और ?oneway_test सहायता पृष्ठ ने independence_test फ़ंक्शन के ऊपर दिए गए कोड के साथ अपने पहले के कार्यान्वयन को प्रतिस्थापित कर दिया है।

+0

आपको बहुत बहुत धन्यवाद, लेकिन मुझे Nemenyi-Damico-Wolfe-Dunn परीक्षण के लिए कोई संदर्भ नहीं मिल रहा है। क्या आप मुझे कुछ संसाधनों के लिए इंगित कर सकते हैं? धन्यवाद – dalloliogm

+0

oneway_test (में pkg = सिक्का) मदद पृष्ठ कोड में यह हवाला देते हैं: "Nemenyi-damico-वोल्फ-डन परीक्षण (संयुक्त रैंकिंग) Hollander और वोल्फ (1999), पृष्ठ 244 (जहां स्टील-Dwass परिणाम दिए गए हैं) " और संदर्भ में: माइल्स होलैंडर \ और डगलस ए वोल्फ (1 999)। Nonparametric सांख्यिकीय तरीके, द्वितीय संस्करण। न्यूयॉर्क: जॉन विली एंड संस। –

+0

@ 42- क्या तुकी परीक्षण भी भिन्नता और भिन्नता की एकरूपता ग्रहण नहीं करता है? लेकिन यहां आप एक गैर-पैरामीट्रिक परीक्षण (क्रस्कल-वालिस) के बाद इसका सुझाव दे रहे हैं। इसके अलावा, 'oneway_test' (मोंटे कार्लो aproximation के साथ, यानी' वितरण = अनुमानित (बी = 1000) ') भी गैर-पैरामीट्रिक है। इस मामले के लिए तुकी कैसे ठीक है? –

1

दुर्भाग्यवश मुझे इस तरह के फ़ंक्शन के बारे में पता नहीं है। यदि पहले से कोई नहीं है, तो यह एक ऐसा फ़ंक्शन बनाने का एक दिलचस्प काम होगा जो सभी जोड़ी उपचार तुलनाओं के साथ मैट्रिक्स देता है। एक विपरीत महत्वपूर्ण माना जाता है यदि निम्न असमानता

alt text http://www.statsdirect.com/help/image/stat0199_wmf.gif

जहां टी कश्मीर नमूनों के लिए Kruskal वालिस परीक्षण आंकड़ा है, एस^2 टी आंकड़े के भाजक है संतुष्ट हो जाता है, एन कुल संख्या (है सभी एनआई) और री ith नमूने के लिए रैंकों (पूल के सभी नमूनों से) का योग है, और टी स्वतंत्रता के एनके डिग्री पर छात्र टी वितरण से एक मात्रा है।

मैं जानता हूँ कि मैं बहुत मदद नहीं की :)
मैं भी एक बेहतर जवाब के लिए इंतज़ार कर रहा हूँ

+1

आपको बहुत धन्यवाद, कोई जवाब अच्छा है :-) – dalloliogm

1

मैं सोचा होगा आप निम्न करने में समर्थ होगा:

data(diamonds, package = "ggplot2") 

library(coin) 
library(multcomp) 

kt <- kruskal_test(price ~ clarity, data = diamonds) 
glht(kt, mcp(clarity = "Tukey")) 

लेकिन ऐसा लगता है कि multcompcoin ऑब्जेक्ट्स (अभी तक?) का समर्थन नहीं करता है।

+0

? glht कहते हैं "सामान्य रैखिक परिकल्पना और ** पैरामीट्रिक ** मॉडल के लिए कई तुलना ...", लेकिन Kruskal वालिस परीक्षण एक * गैर ** - पैरामीट्रिक परीक्षण है। – Martin

+0

@ मार्टिन लेकिन दो पैकेजों के लेखकों की जांच करें ... – hadley

+0

उत्तर के लिए धन्यवाद, हालांकि मूल पोस्ट बहुत समय पहले था - मैं खुद को एक ही समस्या से निपट रहा हूं। शायद मैं पूरी तरह से अज्ञानी हूं - लेकिन क्या मैं आपको थोड़ा और विशिष्ट होने के लिए कह सकता हूं, मैं किसी भी मदद की सराहना करता हूं। – Martin

2

आप पीएमसीएमआर पैकेज का उपयोग कर सकते हैं। There इसके बारे में अधिक जानकारी है।

Spelling_Grades <- c(90,87,89,90,75,88,97,99,78,85,72,76,77,79,70) 
Methods <- c("A","A","A","A","B","B","B","B","B","B","C","C","C","C","C") 
kruskalmc(Spelling_Grades~Methods) 

#This method doesn't accept characters that's why I've changed the methods to integer 
Methods <- c(1,1,1,1,2,2,2,2,2,2,3,3,3,3,3) 
posthoc.kruskal.nemenyi.test(Spelling_Grades~Methods) 

उपरोक्त दो विधियां एक ही परिणाम देती हैं।

संबंधित मुद्दे