बनाएं मैं वर्तमान में टेक्स्ट वर्गीकृत करने का प्रयास कर रहा हूं। मेरा डेटासेट बहुत बड़ा है और जैसा कि here सुझाया गया है, मुझे एक स्पैर मैट्रिक्स का उपयोग करने की आवश्यकता है। मेरा सवाल अब है, एक स्पैर मैट्रिक्स में तत्व जोड़ने का सही तरीका क्या है? मान लें उदाहरण के लिए मेरे पास एक मैट्रिक्स एक्स है जो मेरा इनपुट है।SciPy NumPy और SciKit-learn, एक स्पैर मैट्रिक्स
X = np.random.randint(2, size=(6, 100))
अब यह मैट्रिक्स एक्स एक अंडारे (या ऐसा कुछ) के अंडायर जैसा दिखता है।
अगर मैं
X2 = csr_matrix(X)
मैं विरल मैट्रिक्स की क्या ज़रूरत है, लेकिन मैं कैसे sparce मैट्रिक्स के लिए एक और तत्व जोड़ सकते हैं? उदाहरण के लिए इस घने तत्व: [1,0,0,0,1,1,1,0, ..., 0,1,0] एक स्पैस वेक्टर के लिए, मैं इसे स्पैस इनपुट मैट्रिक्स में कैसे जोड़ूं?
आपको इसे वास्तव में पढ़ना चाहिए: http://scikit-learn.org/dev/auto_examples/document_classification_20newsgroups.html – zenpoy
यह मेरा दूसरा दिन पाइथन के साथ काम कर रहा है, जो पढ़ने के लिए दूसरे दिन के लिए शीर्ष पर थोड़ा सा है। मैंने पाया कि बीटीडब्ल्यू – Ojtwist
कुछ चीजें बस अपना समय लेती हैं। शायद आपको पाइथन, नम्पी और सिस्पी पर कुछ ट्यूटोरियल करने में कुछ समय निवेश करना चाहिए। उदाहरण के लिए, दूसरे प्रश्न में उत्तर में मैंने आपको कुछ लिंक की ओर इशारा किया, और जेनपॉय ने आपको एक और दिया। मुझे लगता है कि आपने उन लिंक को नहीं पढ़ा है, क्योंकि आपने दूसरे प्रश्न का उत्तर देने के कुछ ही मिनट बाद इस प्रश्न को पोस्ट किया था। – HerrKaputt