मैं होमवर्क असाइनमेंट के रूप में k-means को लागू करने का प्रयास करता हूं।के-मतलब खाली क्लस्टर
पुनरावृत्तियों के दौरान, अगर क्लस्टर केन्द्रों में से किसी में यह भी डेटा अंक हैं, एक यादृच्छिक डेटा बिंदु से बदलने: मेरा व्यायाम चादर मुझे खाली केन्द्रों के बारे में टिप्पणी निम्नलिखित देता है।
जो मुझे थोड़ा उलझन में डालता है, सबसे पहले विकिपीडिया या अन्य स्रोत जो मैंने पढ़ा है, इसका उल्लेख नहीं है। मैंने आगे 'आपके डेटा के लिए एक अच्छा के चयन' के साथ एक समस्या के बारे में पढ़ा है - अगर मैं खाली था क्लस्टर के लिए नए केंद्र स्थापित करना शुरू करता हूं तो मेरा एल्गोरिदम कैसे अभिसरण करना चाहिए।
यदि मैं खाली क्लस्टर को अनदेखा करता हूं तो मैं 30-40 पुनरावृत्तियों के बाद अभिसरण करता हूं। क्या खाली क्लस्टर को अनदेखा करना गलत है?
'सबसे बड़ा क्लस्टर' से सबसे दूर का बिंदु 'सबसे बड़ा "किस सम्मान में? – ttnphns
मैं इसे तत्वों की संख्या के मामले में सबसे बड़ा समझूंगा - लेकिन आप अपने क्लस्टर सेंटर से सबसे दूर बिंदु भी चुन सकते हैं। – Ketil