2009-05-06 13 views
9

क्या कोई भी अलग और निरंतर विशेषताओं पर क्लस्टरिंग करने के लिए कोई अच्छा एल्गोरिदम जानता है? मैं समान ग्राहकों के समूह की पहचान करने की समस्या पर काम कर रहा हूं और प्रत्येक ग्राहक के पास अलग-अलग और निरंतर गुण होते हैं (ग्राहकों के बारे में सोचें, इस ग्राहक द्वारा उत्पन्न राजस्व की मात्रा, भौगोलिक स्थान और आदि ..)क्लस्टरिंग एल्गोरिदम अलग और निरंतर विशेषताओं के साथ?

परंपरागत रूप से एल्गोरिदम निरंतर विशेषताओं के लिए के-साधन या ईएम काम, क्या होगा यदि हमारे पास निरंतर और अलग-अलग गुणों का मिश्रण हो?

उत्तर

5

यदि मुझे सही याद है, तो COBWEB एल्गोरिदम अलग-अलग विशेषताओं के साथ काम कर सकता है।

और आप अर्थपूर्ण दूरी मीट्रिक बनाने के लिए अलग-अलग विशेषताओं के लिए अलग-अलग 'चाल' भी कर सकते हैं।

आप पहली हिट्स में से एक, ROCK: A Robust Clustering Algorithm for Categorical Attributes के स्पष्ट/अलग विशेषताओं के क्लस्टरिंग के लिए Google पर जा सकते हैं।

0

आप संभावित समाधान के रूप में affinity propagation पर भी देख सकते हैं। लेकिन निरंतर/अलग दुविधा को दूर करने के लिए आपको एक ऐसे कार्य को परिभाषित करने की आवश्यकता है जो अलग-अलग राज्यों को मानती है।

0

मैं वास्तव में उपयोगकर्ताओं को अलग-अलग विशेषताओं के जोड़ प्रस्तुत करता हूं और उन्हें अपनी निकटता को परिभाषित करने के लिए कहता हूं। आप उन्हें [synonym..very विदेशी] या इसी तरह से पहुंचने वाले पैमाने के साथ पेश करेंगे। कई लोग ऐसा करने के बाद आप गैर-रैखिक विशेषता मानों के लिए व्यापक रूप से स्वीकार्य निकटता फ़ंक्शन के साथ समाप्त हो जाएंगे।

1

आर क्लस्टरिंग के लिए एक शानदार उपकरण है - मानक दृष्टिकोण daisy का उपयोग करके आपके मिश्रित डेटा पर असमानता मैट्रिक्स की गणना करना होगा, फिर agnes का उपयोग करके उस मैट्रिक्स के साथ क्लस्टरिंग करना होगा।

cba module on CRAN में ROCK के आधार पर बाइनरी भविष्यवाणियों पर क्लस्टर करने के लिए एक फ़ंक्शन शामिल है।

0

एन-1 बाइनरी सूचक गुणों (जहां एन श्रेणियों की संख्या है) की एक श्रृंखला में अपने प्रत्येक विशिष्ट विशेषताओं को बदलने के बारे में कैसे? आपको उच्च आयाम से डरना नहीं चाहिए, क्योंकि एक स्पैर प्रतिनिधित्व (जैसे महोत्स SequentialAccessSparseVector नियोजित किया जा सकता है)। एक बार ऐसा करने के बाद, आप शास्त्रीय के-साधन या जो मानक मानक-केवल क्लस्टरिंग एल्गोरिदम का उपयोग कर सकते हैं।

संबंधित मुद्दे