क्लारा का k- medoids() फ़ंक्शन दूरी का उपयोग करता है समूहों के रूप में तो मैं इस पैटर्न मिलती है:आर में दूरी के बजाय प्रवृत्ति द्वारा क्लस्टर कैसे करें?
a <- matrix(c(0,1,3,2,0,.32,1,.5,0,.35,1.2,.4,.5,.3,.2,.1,.5,.2,0,-.1), byrow=T, nrow=5)
cl <- clara(a,2)
matplot(t(a),type="b", pch=20, col=cl$clustering)
लेकिन मैं एक क्लस्टरिंग विधि है कि प्रत्येक पंक्ति के लिए एक समूह प्रदान करती है पता लगाना चाहते हैं इसकी प्रवृत्ति के मुताबिक, लाइन 1, 2 और 3 एक क्लस्टर और लाइन 4 और 5 के दूसरे हैं।
क्या यह @joran ने प्रस्तावित किया है से अलग है? मुझे अंतर नहीं दिख रहा है – nachocab
सिर्फ अपने उत्तर के माध्यम से पढ़ना: नहीं, यह काफी अलग नहीं है। मैं एक अलग स्केलिंग का सुझाव दे रहा हूँ। हालांकि, मुख्य बिंदु जो मैं इंगित करना चाहता था वह यह है कि यह प्रीप्रोकैसिंग के महत्वपूर्ण चरण से संबंधित है जिसे आपको उपेक्षित नहीं करना चाहिए। यही कारण है कि केडीडी प्रक्रिया के बारे में हमेशा इतना बात होती है: https://en.wikipedia.org/wiki/Data_mining#Process वास्तविक खनन में यह 9 0% प्रयास है, यह वैज्ञानिक परिणामों का 5% अधिक है, जो सबसे अधिक है नए एल्गोरिदम पर ध्यान केंद्रित करें। –