में Agglomerative क्लस्टरिंग मेरे पास एक साधारण 2-आयामी डेटासेट है जो मैं एक agglomerative तरीके से क्लस्टर करना चाहता हूँ (उपयोग करने के लिए क्लस्टर की इष्टतम संख्या को नहीं जानते)। एकमात्र तरीका है कि मैं अपने डेटा को सफलतापूर्वक क्लस्टर करने में सक्षम हूं, फ़ंक्शन को 'maxclust' मान देकर है।Matlab
सादगी के लिए, मान लें कि यह मेरा डाटासेट है:
X=[ 1,1;
1,2;
2,2;
2,1;
5,4;
5,5;
6,5;
6,4 ];
स्वाभाविक रूप से, मैं इस डेटा 2 समूहों बनाने के लिए चाहते हैं। मैं समझता हूँ कि अगर मैं इस जानता था, मैं सिर्फ कह सकते हैं:
T = clusterdata(X,'maxclust',2);
और जो प्रत्येक क्लस्टर में गिरावट मैं कह सकते हैं बताते हैं खोजने के लिए:
cluster_1 = X(T==1, :);
और
cluster_2 = X(T==2, :);
लेकिन बिना यह जानकर कि 2 क्लस्टर इस डेटासेट के लिए इष्टतम होंगे, मैं इन आंकड़ों को कैसे क्लस्टर कर सकता हूं?
धन्यवाद
इसी तरह के प्रश्न: [व्यवहार में पदानुक्रमित क्लस्टरिंग के लिए क्या रोक-मानदंड अभ्यास में उपयोग किए जाते हैं?] (Http://stats.stackexchange.com/q/2597) – Amro
@Amro नाइस लिंक! –