2010-02-27 14 views
26

मैं यह देखने की कोशिश कर रहा हूं कि दोनों के प्रदर्शन की तुलना उन उद्देश्यों के आधार पर की जा सकती है, जिन पर वे काम करते हैं?"के साधन" और "अस्पष्ट सी साधन" उद्देश्य कार्यों के बीच क्या अंतर है?

+7

चलो! बंद न करें ... क्लस्टरिंग प्रोग्रामिंग से संबंधित है, उसी स्तर पर जो औपचारिक व्याकरण पर सॉर्टिंग एल्गोरिदम या प्रश्न कहता है! – mjv

उत्तर

22

Btw, Fuzzy-C-Means (FCM) एल्गोरिथ्म क्लस्टरिंग भी शीतल कश्मीर साधन के रूप में जाना जाता है।

उद्देश्य कार्य लगभग समान हैं, केवल एक वेक्टर की शुरुआत होने का अंतर है जो प्रत्येक क्लस्टर को दिए गए बिंदु से संबंधित प्रतिशत का प्रतिशत व्यक्त करता है। इस वेक्टर को "कठोरता" एक्सपोनेंट में जमा किया जाता है जिसका उद्देश्य मजबूत कनेक्शन (और कमजोर लोगों के वजन को कम करने पर) को अधिक महत्व देना है; संयोग से, जब कठोरता कारक अनंतता की ओर जाता है जिसके परिणामस्वरूप वेक्टर बाइनरी मैट्रिक्स बन जाता है, इसलिए एफसीएम मॉडल को के-मीन्स के समान बनाते हैं।

मुझे लगता है कि क्लस्टर के साथ कुछ संभावित मुद्दे को छोड़कर जिनके पास कोई अंक नहीं है, एक अनंत कठोरता कारक (= शुरू करके) द्वारा एफसीएम के साथ के-मीन्स एल्गोरिदम का अनुकरण करना संभव है वेक्टर जो एक्सक्टर में एक्सपोनिएशन के बदले में वेक्टर में सबसे बड़ा मूल्य बदलता है, और अन्य मानों को शून्य करता है)। यह निश्चित रूप से के-मीन्स चलाने का एक बहुत ही अक्षम तरीका है, क्योंकि एल्गोरिदम को फिर एक वास्तविक एफसीएम के साथ कई संचालन करना पड़ता है (यदि केवल 1 और 0 मानों के साथ, जो अंकगणित को सरल बनाता है, लेकिन जटिलता नहीं)

के साथ प्रदर्शन के संबंध में, FCM इसलिए प्रत्येक आयाम (भी घातांक खाते में कठोरता लेने के लिए गिनती नहीं) के लिए, प्रत्येक बिंदु के लिए कश्मीर (समूहों की यानी संख्या) गुणा प्रदर्शन करने की जरूरत है। यह, साथ ही निकटता वेक्टर की गणना और प्रबंधन के लिए आवश्यक ओवरहेड, बताता है कि क्यों एफसीएम सादा के-मीन की तुलना में काफी धीमी है।

लेकिन एफसीएम/सॉफ्ट-के-मीन हार्ड-के-मीन्स की तुलना में कम "बेवकूफ" है, जब यह विस्तारित क्लस्टर के लिए आता है (जब अन्य आयामों में अन्यथा सुसंगत बिंदु किसी विशेष आयाम या दो के साथ बिखरे होते हैं) और यही कारण है कि यह अभी भी आसपास है ;-)

इसके अलावा, मैंने अभी इसके बारे में सोचा है, लेकिन किसी भी "गणितीय" विचार को नहीं रखा है, एफसीएम हार्ड के-मीन्स से तेज़ी से अभिसरण कर सकता है, कुछ हद तक बड़ी कम्प्यूटेशनल आवश्यकता को ऑफ़सेट कर रहा है एफसीएम का।

+0

एफसीएम क्यों तेजी से अभिसरण करना चाहिए? यह वास्तव में वास्तव में अभिसरण नहीं करता है, आपको एक निश्चित दहलीज पर रोकना होगा, जब सापेक्ष असाइनमेंट अब "पर्याप्त" नहीं बदलते हैं; जीएमएम-ईएम क्लस्टरिंग की तरह। –

+0

@ एनी-मूस: गणितीय अर्थ में एफसीएम और के-मीन्स _converge_ दोनों, जो कि आप 'सापेक्ष असाइनमेंट अब पर्याप्त नहीं बदलते "के साथ वर्णन करते हैं।' दूसरे शब्दों में लगातार क्लस्टरिंग समाधान प्रदान किया जाता है इन एल्गोरिदम के पुनरावृत्तियों में पहले, एक पुनरावृत्ति से अगले में बहुत कुछ बदल जाता है, लेकिन अंततः परिवर्तन छोटे और छोटे हो जाते हैं क्योंकि फ़ंक्शन इसकी सीमा तक पहुंचता है। एक व्यावहारिक परिवर्तन सीमा तक पहुंचने के बाद पुन: प्रयास करना सुरक्षित है क्योंकि समारोह अभिसरण है: अधिक पुनरावृत्त करने से काफी अलग परिणाम नहीं मिलेगा ... – mjv

+0

... जो अभी तक मैं कोशिश करने और अध्ययन करने के लिए नहीं हूं, यह है कि क्या एफसीएम वास्तव में अभिसरण करता है कड़ी मेहनत से तेज़ दूसरे शब्दों में यदि वांछित "स्थिर" समाधान तक पहुंचने के लिए एफसीएम (सादे के-मीन के साथ) के साथ कम पुनरावृत्तियों को लेता है। – mjv

16

K-Means clustering और Fuzzy-C Means Clustering दृष्टिकोण में बहुत समान हैं। मुख्य अंतर यह है कि, फ़ज़ी-सी मीन्स क्लस्टरिंग में, प्रत्येक बिंदु में एक विशेष क्लस्टर से जुड़ा भार होता है, इसलिए एक बिंदु "क्लस्टर में" नहीं बैठता है जितना क्लस्टर के लिए कमजोर या मजबूत सहयोग होता है, क्लस्टर के केंद्र में विपरीत दूरी से निर्धारित किया जाता है।

फ़ज़ी-सी का मतलब के माध्यम से धीमी गति से चलने वाला है, क्योंकि यह वास्तव में और अधिक काम कर रहा है। प्रत्येक बिंदु का मूल्यांकन प्रत्येक क्लस्टर के साथ किया जाता है, और प्रत्येक मूल्यांकन में अधिक संचालन शामिल होते हैं। के-मीन्स को केवल दूरी की गणना करने की आवश्यकता है, जबकि अस्पष्ट सी का मतलब है कि एक पूर्ण विपरीत दूरी भार करने की आवश्यकता है।

1

लोगों ने तकनीकी रूप से लिखा है और प्रत्येक उत्तर अच्छी तरह लिखा गया है। लेकिन मैं जो कहना चाहता हूं वह आम भाषा में समान है। के का मतलब है क्लस्टर क्लस्टर को पूरे डेटासेट को क्लस्टर की संख्या में जहां एक डेटा केवल एक क्लस्टर से संबंधित होना चाहिए। फ़ज़ी सी-मतलब क्लस्टर की के संख्या बनाते हैं और फिर प्रत्येक क्लस्टर को प्रत्येक डेटा असाइन करते हैं, लेकिन उनकी इच्छा एक कारक होगी जो परिभाषित करेगा कि डेटा उस क्लस्टर से कितना दृढ़ता से संबंधित है।

संबंधित मुद्दे