डेटासेट पांडा डेटाफ्रेम है। यह sklearn.cluster.KMeansक्या पांडस डेटाफ्रेम ऑब्जेक्ट काम sklearn kmeans क्लस्टरिंग के साथ करेगा?
km = KMeans(n_clusters = n_Clusters)
km.fit(dataset)
prediction = km.predict(dataset)
है यह मैं का निर्धारण कैसे इकाई अंतर्गत आता है है जो करने के लिए क्लस्टर:
A 1 2 3 4 5 6
B 2 3 4 5 6 7
C 1 4 2 7 8 1
...
जहां ए, बी:
for i in range(len(prediction)):
cluster_fit_dict[dataset.index[i]] = prediction[i]
यह कैसे डाटासेट लग रहा है , सी सूचकांक
क्या यह के-साधनों का उपयोग करने का सही तरीका है?
आपका प्रश्न थोड़ा अस्पष्ट है, sklearn आम तौर पर इनपुट के रूप में numpy arrays स्वीकार करता है और इसलिए पांडा डेटाफ्रेम संगत हैं, कुछ मामलों में मुझे पता चला है कि आपको एक numpy सरणी के लिए वापस पूछने की आवश्यकता है: 'df.values' या df। col.values' एक उदाहरण के रूप में, इसलिए मूल रूप से इसे काम करना चाहिए, कृपया कोशिश करें और यदि आप एक स्नैग दबाते हैं तो कोड और डेटा – EdChum