ठीक है, की सुविधा देता है हमें सरल प्रक्रिया के बाद कि ग्राफ के लिए निकटता मैट्रिक्स डब्ल्यू निर्माण: यदि आसन्न vertexes के दोनों i-वें और जे-वें एक ही रंग के तो उन दोनों के बीच बढ़त के वजन रहे हैं W_ {i, j} बड़ी संख्या है (जिसे आप बाद में अपने प्रयोगों में ट्यून करेंगे) और अन्यथा यह कुछ छोटी संख्या है जिसे आप समान रूप से समझेंगे।
अब, मैट्रिक्स के लैपलासीन को एल = डी - डब्ल्यू के रूप में लिखने दें, जहां डी तत्वों के साथ एक विकर्ण मैट्रिक्स है d_ {i, i} डब्ल्यू i-th पंक्ति के बराबर है।
अब, कोई आसानी से दिखा सकता है कि एफएलएफ^टी का मूल्य, जहां एफ कुछ मनमाना वेक्टर है, यदि छोटे समायोजन भार वाले चरम सीमाएं करीब एफ मान हैं। आप ग्राफ के लिए समन्वय प्रणाली सेट करने के तरीके के बारे में सोच सकते हैं I-vertex में 1 डी स्पेस में f_i समन्वय है।
अब, चलिए कुछ ऐसे वैक्टर f^k चुनते हैं जो हमें कुछ यूक्लिडियन स्पेस में अंक के सेट के रूप में ग्राफ का प्रतिनिधित्व करते हैं, उदाहरण के लिए, के-मतलब काम करता है: अब आपके पास i-th vertex है शुरुआती ग्राफ के f^1_i, f^2_i, ... और प्रारंभिक ग्राफ पर समान रंग के आसन्न वैक्टर भी समन्वयित करते हैं, इस नए समन्वय स्थान में बंद हो जाएंगे।
वैक्टर एफ को चुनने के बारे में सवाल एक साधारण है: केवल मैट्रिक्स एल के कुछ ईजीनवेक्टरों को ले लें जो कि छोटे लेकिन nonzero eigenvalues के अनुरूप हैं।
यह स्पेक्ट्रल क्लस्टरिंग नामक एक प्रसिद्ध विधि है।
आगे पढ़ने: सांख्यिकीय सीखने के तत्व: डेटा खनन, अनुमान, और भविष्यवाणी।ट्रेवर हैस्टी, रॉबर्ट टीबशिरानी और जेरोम फ्राइडमैन
जो लेखकों पेज http://www-stat.stanford.edu/~tibs/ElemStatLearn/
से मुक्त करने के लिए उपलब्ध है द्वारा यह क्या scikit सीखने SpectralClustering में कार्यान्वित किया जाता नहीं है? –
@Juh_ शायद, मुझे लिखने के समय विज्ञान-सीखने के बारे में पता नहीं था। – Moonwalker