मुझे स्मृति त्रुटि मिली जब मैं scikit के dbscan एल्गोरिदम चला रहा था। मेरा डेटा लगभग 20000 * 10000 है, यह एक बाइनरी मैट्रिक्स है।विज्ञान-सीखने में, क्या डीबीएससीएएन स्पैर मैट्रिक्स का उपयोग कर सकता है?
(शायद यह नहीं उपयुक्त इस तरह के एक मैट्रिक्स के साथ DBSCAN उपयोग करने के लिए है। मैं मशीन सीखने की शुरुआत कर रहा हूँ। मैं सिर्फ एक क्लस्टर विधि है जो एक प्रारंभिक क्लस्टर नंबर की जरूरत नहीं है पता लगाना चाहते हैं)
वैसे भी मैं स्पैर मैट्रिक्स और विज्ञानकिट की विशेषता निष्कर्षण मिला।
http://scikit-learn.org/dev/modules/feature_extraction.html http://docs.scipy.org/doc/scipy/reference/sparse.html
लेकिन मैं अभी भी पता नहीं है कि यह कैसे उपयोग करने के लिए है। डीबीएससीएएन के विनिर्देशन में, स्पैर मैट्रिक्स का उपयोग करने के बारे में कोई संकेत नहीं है। क्या इसकी अनुमति नहीं है?
यदि कोई जानता है कि डीबीएससीएएन में स्पैर मैट्रिक्स का उपयोग कैसे करें, तो कृपया मुझे बताएं। या आप मुझे एक और उपयुक्त क्लस्टर विधि बता सकते हैं।
की संभावित डुप्लिकेट [scikit सीखने DBSCAN स्मृति उपयोग] (http://stackoverflow.com/questions/16381577/scikit-learn-dbscan-memory-usage) –