2011-08-07 11 views
8

मैं क्लस्टर को नौकरियों का सेट सेट करना चाहता हूं। नौकरियां गुण हैं:मिश्रित चर (स्पष्ट और संख्यात्मक) दूरी फ़ंक्शन

  1. स्पष्ट: स्थिति, डिप्लोमा, कौशल
  2. संख्यात्मक: वेतन, अनुभव के वर्षों के

मेरा प्रश्न है: कैसे के बीच की दूरी की गणना करने के अलग नौकरियां?
जैसे job1 (प्रोग्रामर, बी एस कंप्यूटर विज्ञान, (जावा, .net, जिम्मेदारी), 1500, 3)
और job2 (परीक्षक, बी एस कंप्यूटर विज्ञान, (काले और सफेद बॉक्स टेस्टिंग), 1200,1)

पीएस: मैं डेटा खनन क्लस्टरिंग में शुरुआत कर रहा हूं, मैं आपकी मदद की अत्यधिक सराहना करता हूं।

उत्तर

3

आप इसे अपने शुरुआती बिंदु के रूप में ले सकते हैं: http://www.econ.upf.edu/~michael/stanford/maeb4.pdf। स्पष्ट डेटा के बीच की दूरी अंत में अच्छी तरह से समझाया गया है। http://biocluster.ucr.edu/~tgirke/HTML_Presentations/Manuals/Clustering/clustering.pdf

सामान्य में, असतत डेटा के लिए क्लस्टरिंग या तो मायने रखता है के उपयोग से संबंधित है (उदाहरण के लिए वैक्टर में overlaps):

2

यहाँ कई अलग अलग क्लस्टरिंग तरीकों का एक अच्छा माध्यम से गुजरने के लिए और उन्हें कैसे आर में उपयोग करने के लिए है या गणना से व्युत्पन्न कुछ आंकड़ों से संबंधित है। जितना मैं सांख्यिकीय पक्ष को संबोधित करना चाहता हूं, मुझे लगता है कि आप एल्गोरिदम में रुचि रखते हैं, इसलिए मैं इसे छोड़ दूंगा।

संबंधित मुद्दे