चूंकि आप कॉलम स्लाइसिंग कर रहे हैं, इसलिए सीएसआर के बजाय सीएससी का उपयोग करके मैट्रिक्स को स्टोर करना बेहतर हो सकता है। लेकिन यह इस बात पर निर्भर करेगा कि आप मैट्रिक्स के साथ और क्या कर रहे हैं।
सीएससी मैट्रिक्स में कॉलम के माध्य की गणना करने के लिए आप मैट्रिक्स के mean()
फ़ंक्शन का उपयोग कर सकते हैं।
मानक विचलन की गणना करने के लिए कुशलतापूर्वक थोड़ा और प्रयास शामिल करने जा रहा है।
col = A.getcol(colindex)
फिर तो जैसे विचरण गणना: सबसे पहले, आप इस तरह अपने विरल स्तंभ मिल लगता
N = col.shape[0]
sqr = col.copy() # take a copy of the col
sqr.data **= 2 # square the data, i.e. just the non-zero data
variance = sqr.sum()/N - col.mean()**2
स्रोत
2013-03-29 11:39:35
[प्रविष्टियों समाप्त करें] (http://docs.scipy.org/doc /scipy/reference/generated/scipy.sparse.csr_matrix.sum.html#scipy.sparse.csr_matrix.sum) और माध्य की गणना करने के लिए m * n द्वारा विभाजित करें। मान लीजिए कि मैट्रिक्स के लिए इसका मतलब क्या है। मैं पहले कभी मैट्रिक्स मतलब नहीं आया है। –
हाय डेविड, मुझे अपना प्रश्न संपादित करना चाहिए था, मैं एक वेक्टर के माध्य और std को खोजने के लिए देख रहा हूं, लेकिन इसके स्पैस फॉर्म में, क्या आप उन दो मानों को प्राप्त करते हैं? – Curious
तो, टिप्पणी में मेरी परिभाषा सटीक है? यह 988 मूल्यों का योग है, जो 988 से विभाजित है? और यदि आप कॉलम के साथ काम करते हैं तो आप सीएसआर का उपयोग क्यों कर रहे हैं? –