पायथन में, मैं डेटा के दो सरणी के बीच सहसंबंध और सांख्यिकीय महत्व की गणना कैसे कर सकता हूं?

मैं डेटा के दो समान रूप से लंबे समय तक सरणियों के साथ डेटा के सेट है, या मैं दो आइटम प्रविष्टियों की एक सरणी बना सकते हैं, और मैं सह-संबंध और सांख्यिकीय महत्व डेटा का प्रतिनिधित्व करती है (जो कसकर सहसंबद्ध किया जा सकता गणना करने के लिए चाहते हैं, या कोई सांख्यिकीय रूप से महत्वपूर्ण सहसंबंध नहीं हो सकता है)।पायथन में, मैं डेटा के दो सरणी के बीच सहसंबंध और सांख्यिकीय महत्व की गणना कैसे कर सकता हूं?

मैं अजगर में प्रोग्रामिंग हूँ और scipy और numpy स्थापित की है। मैंने देखा और पाया Calculating Pearson correlation and significance in Python, लेकिन ऐसा लगता है कि डेटा को छेड़छाड़ की जानी चाहिए ताकि यह एक निर्दिष्ट सीमा में हो।

उचित तरीके से करने के लिए, मुझे लगता है, scipy पूछ सकते हैं या numpy मुझे सहसंबंध और दो सरणियों के सांख्यिकीय महत्व देने के लिए क्या है?

स्रोत

2012-06-20 JonathanHayward

तुम्हें क्या लगता है कि 'scipy.stats.pearsonr' की संख्या में हेरफेर किया जाना चाहता है तो यह एक निर्दिष्ट सीमा में आता है? – ecatmur

_correlation coefficient_ -1 और +1 के बीच आता है। यह आउटपुट है, इनपुट नहीं। –

आप इन दो सरणियों, जिसके खाते में उन दोनों के बीच सह-संबंध लेता के बीच Mahalanobis distance उपयोग कर सकते हैं। scipy.spatial.distance.mahalanobis

वहाँ एक अच्छा उदाहरण here

स्रोत

2012-06-20 14:37:19

scipy.spatial.distance.euclidean()

यह 2 अंकों के बीच इयूक्लिडियन दूरी देता है 2 है:

समारोह scipy पैकेज में है एनपी सरणी, 2 सूचियां, आदि

import scipy.spatial.distance as spsd 
spsd.euclidean(nparray1, nparray2)

आप फाई कर सकते हैं nd अधिक जानकारी यहां http://docs.scipy.org/doc/scipy/reference/spatial.distance.html

स्रोत

2012-06-20 14:55:25 Froyo

यदि आप पियरसन सहसंबंध गुणांक की गणना करना चाहते हैं, तो scipy.stats.pearsonr जाने का रास्ता है; हालांकि, महत्व केवल बड़े डेटा सेट के लिए सार्थक है। इस फ़ंक्शन को निर्दिष्ट सीमा में गिरने के लिए डेटा को घुमाने के लिए आवश्यक नहीं है। सहसंबंध के लिए मूल्य [-1,1] अंतराल में पड़ता है, शायद यह भ्रम था?

महत्व बहुत महत्वपूर्ण नहीं है, तो आप numpy.corrcoef() उपयोग कर सकते हैं।

महालनोबिस दूरी दो सरणियों के बीच संबंध को ध्यान में रखता है, लेकिन यह एक दूरी मापन, नहीं एक संबंध प्रदान करता है। (गणित के अनुसार, महालनोबिस दूरी एक सच्चे सुदूर क्रिया नहीं है,। फिर भी, यह बहुत अच्छा लाभ के लिए कुछ संदर्भों में इस तरह के रूप में इस्तेमाल किया जा सकता है)

स्रोत

2012-06-20 14:55:29 cjohnson318

पायथन में, मैं डेटा के दो सरणी के बीच सहसंबंध और सांख्यिकीय महत्व की गणना कैसे कर सकता हूं?

उत्तर

संबंधित मुद्दे