2010-01-29 12 views
12

मैं थोड़ा सा उलझन में हूं कि "फीचर चयन/निकालने वाला/वजन" का मतलब क्या है और उनके बीच का अंतर क्या है। जैसा कि मैंने साहित्य कभी कभी मैं के रूप में मैं काफी शिथिल शब्द का इस्तेमाल किया लगता है खो दिया है लगता है, पढ़ने के लिए मेरी प्राथमिक चिंता कर रहे हैं -फीचर चयन, फीचर निष्कर्षण, फीचर वजन के बीच अंतर

  1. जब फ़ीचर आवृत्ति, फ़ीचर उपस्थिति के लोगों के बात करते हैं - यह सुविधा चयन है?

  2. जब लोग सूचना लाभ, अधिकतम एंट्रॉपी जैसे एल्गोरिदम की बात करते हैं - क्या यह अभी भी सुविधा का चयन है।

  3. यदि मैं क्लासिफायर को प्रशिक्षित करता हूं - एक फीचर सेट के साथ जो क्लासिफायर को किसी दस्तावेज़ के भीतर किसी शब्द की स्थिति को नोट करने के लिए कहता है - क्या कोई अभी भी इस सुविधा चयन को कॉल करेगा?

धन्यवाद राहुल दिघे

उत्तर

6

फ़ीचर चयन आगे की प्रक्रिया के लिए अपने सेट से "रोचक" सुविधाओं को चुनने की प्रक्रिया है।

फ़ीचर फ्रीक्वेंसी बस इतना है कि एक सुविधा दिखाई देती है।

सूचना लाभ, अधिकतम एंट्रॉपी इत्यादि भारोत्तोलन विधियां हैं, जो फ़ीचर फ्रीक्वेंसी का उपयोग करती हैं, जो बदले में, आपको फ़ीचर चयन करने की अनुमति देती है। इस तरह यह

सोचें:

आप कोष पार्स और एक शब्द/दस्तावेज़ मैट्रिक्स पैदा करते हैं। यह मैट्रिक्स शर्तों की गिनती के रूप में शुरू होता है, और वे किस दस्तावेज़ में दिखाई देते हैं (सरल आवृत्ति)।

उस मैट्रिक्स को और अधिक सार्थक बनाने के लिए, आप आवृत्ति सहित कुछ फ़ंक्शन के आधार पर शर्तों को वज़न देते हैं (जैसे आवृत्ति-व्यस्त दस्तावेज़ आवृत्ति, सूचना लाभ, अधिकतम एन्ट्रॉपी)। अब मैट्रिक्स में मैट्रिक्स में अन्य शर्तों के संबंध में वजन, या प्रत्येक शब्द का महत्व शामिल है।

एक बार आपके पास यह हो जाने के बाद, आप केवल सबसे महत्वपूर्ण शर्तों को रखने के लिए सुविधा चयन का उपयोग कर सकते हैं (यदि आप वर्गीकरण या वर्गीकरण जैसी चीजें कर रहे हैं) और आगे विश्लेषण करें।

+0

तो फीचर निष्कर्षण क्या है? –

+2

फ़ीचर निष्कर्षण आपके डेटा की आयामता को कम करने की प्रक्रिया है (आमतौर पर एसवीडी, पीसीए, आदि के माध्यम से)। इस लिंक को देखें: http://en.wikipedia.org/wiki/Feature_extraction – GalacticJello

8

फ़ीचर निष्कर्षण: पर घ आयामी वेक्टर (घ < डी) (रेखीय या गैर रैखिक) डी आयामी सदिश का प्रक्षेपण द्वारा आयामी स्वरूप को कम। उदाहरण: मुख्य घटक विश्लेषण

फ़ीचर चयन: मूल चर के सबसेट का चयन करके आयाम को कम करें। उदाहरण: आगे या पीछे सुविधा चयन

17

Rahul-

ये सब अच्छा जवाब नहीं है। एक बात जो मैं उल्लेख करूंगा वह यह है कि चयन और निष्कर्षण के बीच मौलिक अंतर यह है कि आप डेटा का इलाज कैसे कर रहे हैं।

फ़ीचर निष्कर्षण विधियां परिवर्तनीय हैं - यह है कि आप इसे कम डेटा वाले नए फीचर स्पेस में प्रोजेक्ट करने के लिए अपने डेटा में बदलाव लागू कर रहे हैं। पीसीए, और एसवीडी इस के उदाहरण हैं।

फ़ीचर चयन तरीकों मूल कुछ मानदंडों के आधार पर सेट से सुविधाओं का चयन, सूचना लाभ, सहसंबंध और म्युचुअल सूचना सिर्फ मानदंड है कि महत्वहीन या अनावश्यक सुविधाओं को फ़िल्टर करने के लिए उपयोग किया जाता है। एंबेडेड या रैपर विधियों, जिन्हें वे कहते हैं, विशेष चयन क्लासिफायर का उपयोग सुविधा चयन प्राप्त करने और डेटासेट को एक ही समय में वर्गीकृत करने के लिए कर सकते हैं।

समस्या स्थान का वास्तव में एक अच्छा अवलोकन here दिया गया है।

शुभकामनाएं!

+0

वास्तव में महान स्पष्टीकरण। हालांकि लिंक मर चुका है ... :) – Boern

संबंधित मुद्दे