2012-06-20 8 views
9

मैं डेटा के दो समान रूप से लंबे समय तक सरणियों के साथ डेटा के सेट है, या मैं दो आइटम प्रविष्टियों की एक सरणी बना सकते हैं, और मैं सह-संबंध और सांख्यिकीय महत्व डेटा का प्रतिनिधित्व करती है (जो कसकर सहसंबद्ध किया जा सकता गणना करने के लिए चाहते हैं, या कोई सांख्यिकीय रूप से महत्वपूर्ण सहसंबंध नहीं हो सकता है)।पायथन में, मैं डेटा के दो सरणी के बीच सहसंबंध और सांख्यिकीय महत्व की गणना कैसे कर सकता हूं?

मैं अजगर में प्रोग्रामिंग हूँ और scipy और numpy स्थापित की है। मैंने देखा और पाया Calculating Pearson correlation and significance in Python, लेकिन ऐसा लगता है कि डेटा को छेड़छाड़ की जानी चाहिए ताकि यह एक निर्दिष्ट सीमा में हो।

उचित तरीके से करने के लिए, मुझे लगता है, scipy पूछ सकते हैं या numpy मुझे सहसंबंध और दो सरणियों के सांख्यिकीय महत्व देने के लिए क्या है?

+3

तुम्हें क्या लगता है कि 'scipy.stats.pearsonr' की संख्या में हेरफेर किया जाना चाहता है तो यह एक निर्दिष्ट सीमा में आता है? – ecatmur

+2

_correlation coefficient_ -1 और +1 के बीच आता है। यह आउटपुट है, इनपुट नहीं। –

उत्तर

2

आप इन दो सरणियों, जिसके खाते में उन दोनों के बीच सह-संबंध लेता के बीच Mahalanobis distance उपयोग कर सकते हैं। scipy.spatial.distance.mahalanobis

वहाँ एक अच्छा उदाहरण here

0

scipy.spatial.distance.euclidean()

यह 2 अंकों के बीच इयूक्लिडियन दूरी देता है 2 है:

समारोह scipy पैकेज में है एनपी सरणी, 2 सूचियां, आदि

import scipy.spatial.distance as spsd 
spsd.euclidean(nparray1, nparray2) 

आप फाई कर सकते हैं nd अधिक जानकारी यहां http://docs.scipy.org/doc/scipy/reference/spatial.distance.html

7

यदि आप पियरसन सहसंबंध गुणांक की गणना करना चाहते हैं, तो scipy.stats.pearsonr जाने का रास्ता है; हालांकि, महत्व केवल बड़े डेटा सेट के लिए सार्थक है। इस फ़ंक्शन को निर्दिष्ट सीमा में गिरने के लिए डेटा को घुमाने के लिए आवश्यक नहीं है। सहसंबंध के लिए मूल्य [-1,1] अंतराल में पड़ता है, शायद यह भ्रम था?

महत्व बहुत महत्वपूर्ण नहीं है, तो आप numpy.corrcoef() उपयोग कर सकते हैं।

महालनोबिस दूरी दो सरणियों के बीच संबंध को ध्यान में रखता है, लेकिन यह एक दूरी मापन, नहीं एक संबंध प्रदान करता है। (गणित के अनुसार, महालनोबिस दूरी एक सच्चे सुदूर क्रिया नहीं है,। फिर भी, यह बहुत अच्छा लाभ के लिए कुछ संदर्भों में इस तरह के रूप में इस्तेमाल किया जा सकता है)

संबंधित मुद्दे

 संबंधित मुद्दे