2012-09-16 11 views
5

मैं वेका में विशेषता चयन करने की कोशिश कर रहा हूं। मैं InfoGainAttributeEval को मूल्यांकनकर्ता के रूप में उपयोग करना चाहता हूं, क्योंकि मैंने पढ़ा है कि यह आपसी जानकारी के बराबर है, और रैंकर एक खोज विधि के रूप में है। क्या मुझे प्रशिक्षण और परीक्षण सेट दोनों में विशेषता चयन करना चाहिए? साथ ही, मैं एन पैरामीटर के लिए सही मान कैसे चुन सकता हूं?वीका विशेषता चयन

धन्यवाद आपके समय के लिए एक बहुत,

नादिया

उत्तर

1

ट्रेन और परीक्षण पर अलग विशेषता चयन को लागू करने अलग-अलग विशेषताओं की एक चयन में परिणाम हो सकता है, जिससे उन्हें असंगत बना रही है। इस प्रकार यह सुनिश्चित करने के लिए कि दोनों सेटों में वही विशेषताएं हैं जिन्हें आपको अपने संपूर्ण डेटासेट पर विशेषता चयन लागू करने की आवश्यकता है। एक बार जब आप सबसे उपयोगी विशेषताओं का चयन कर लेते हैं तो आप अपने डेटा को ट्रेन और टेस्ट सेट में विभाजित करते हैं।

उपयोग करने के लिए -N का मूल्य, मैं आपकी कुल राशि का उपयोग करूंगा। इसके परिणामस्वरूप आपके सभी विशेषताओं की रैंकिंग सूची होगी और आप अपने सभी विशेषताओं के विभिन्न स्कोर का मूल्यांकन कर सकते हैं। इसके बाद आप एक स्पष्ट सीमा को स्पॉट कर सकते हैं जो किसी भी उपयोगी जानकारी वाले गुणों को अलग करता है जो क्लासिफायर को उन गुणों से प्रशिक्षित करने के लिए प्रशिक्षित करता है जो कुछ भी नहीं जोड़ते हैं। मैं -T विकल्प का उपयोग करके इस दहलीज को सेट कर दूंगा।

+0

हैलो @ सिस्को! मुझे लगता है कि बैच फ़िल्टरिंग प्रशिक्षण और परीक्षण सेट संगत बनाने के लिए आपकी विधि के बराबर है। -एन और -टी पैरामीटर के बारे में आपके सुझावों ने मुझे इस मुद्दे को स्पष्ट करने में मदद की और मैं उन्हें वेका में आजमाने की कोशिश कर रहा हूं। जानकारी के लिए बहुत कुछ धन्यवाद और देरी के जवाब के लिए खेद है! – nadia

+0

इस तरह के गुणों को चुनने के गुणों का चयन नहीं करेगा? – fiacobelli

+0

@fiacobelli यह इस बात पर निर्भर करता है कि आपने सीमा को कैसे सेट किया है। यदि आप केवल सर्वश्रेष्ठ प्रदर्शन करने वाली विशेषता लेते हैं और बाकी की अवहेलना करते हैं जो अतिसंवेदनशीलता वास्तव में अधिक संभावना है। मेरी इरादा सलाह उन कई विशेषताओं को लेना था जो कुछ दिलचस्प डेटा धारण करते हैं और उन विशेषताओं को हटाते हैं जिनमें स्पष्ट रूप से मूल्यवान जानकारी की कमी होती है। मैंने अपने जवाब में यह और स्पष्ट कर दिया। – Sicco

संबंधित मुद्दे