8

मैं जाने-माने व्यक्ति Tom Mitchell से पुराने मध्य परीक्षा में एक उदाहरण देखते हैं, इस प्रकार है:रैपर विधि और सूचना फ़िल्टरिंग में सुविधा चयन?

कुल सुविधाओं 1000 एक स्थिति में एक शास्त्रीय फाई एर सीखने पर विचार करें। उनमें से 50 कक्षा के बारे में वास्तव में जानकारीपूर्ण हैं। 50 अन्य सुविधाओं की एक और 50 विशेषताएं प्रत्यक्ष प्रतियां हैं। फाइनल 900 फीचर्स सूचनात्मक नहीं हैं। मान लें कि विशेषताएं कितनी उपयोगी हैं इसका आकलन करने के लिए पर्याप्त डेटा है, और सुविधा चयन विधियां अच्छी थ्रेसहोल्ड का उपयोग कर रही हैं।

How many features will be selected by mutual information filtering? 

समाधान: 100

How many features will be selected by a wrapper method? 

समाधान: 50

मेरे चुनौती कैसे इन समाधान प्राप्त किया जाता है? मैं बहुत कोशिश करता हूं, लेकिन इसके पीछे विचार को समझ नहीं पाया।

उत्तर

7
How many features will be selected by mutual information filtering? 

म्युचुअल जानकारी सुविधा चयन प्रत्येक की उम्मीदवारी की सुविधा स्वतंत्र रूप से मूल्यांकन करता है। चूंकि अनिवार्य रूप से 100 विशेषताएं हैं जो वास्तव में जानकारीपूर्ण हैं, हम पारस्परिक सूचना फ़िल्टरिंग द्वारा 100 विशेषताओं के साथ समाप्त हो जाएंगे।

How many features will be selected by a wrapper method? 

एक आवरण विधि का मूल्यांकन करता है सुविधाओं के सबसेट इस प्रकार यह खाते में सुविधाओं के बीच बातचीत लेता है। चूंकि 50 फीचर्स अन्य 50 फीचर्स की सीधी प्रतियां हैं, इसलिए रैपर विधि को पर पहली 50 फीचर्स पर सशर्त करने में सक्षम है, 50 फीचर्स का दूसरा सेट अतिरिक्त जानकारी को जोड़ रहा है। फ़िल्टरिंग के बाद हमने 50 फीचर्स के साथ समाप्त किया। मान लें कि 50 फीचर्स का पहला सेट A1, A2, ..., A50 है और 50 फीचर्स की प्रति C1, C2, ..., C50 है। चुनी गई सुविधाओं को अंतिम परिणाम लग सकता है जैसे:

A1, C2, A3, A4, C5, C6, ..., A48, A49, C50. 

इस प्रकार प्रत्येक अद्वितीय सुविधा केवल एक घटना नहीं होनी चाहिए (या तो A की सुविधा सेट से या C की सुविधा सेट से)।

-1

आपसी जानकारी फ़िल्टरिंग द्वारा कितनी विशेषताओं का चयन किया जाएगा?

यदि हम प्रश्न विवरण के अनुसार जाते हैं, तो हमारे पास केवल 50 विशेषताओं का चयन होना चाहिए। लेकिन यह फ़िल्टरिंग वैरिएबल के साथ अनुमान लगाने के लिए सहसंबंध पर आधारित है। और, म्यूचुअल सूचना फ़िल्टरिंग के प्रमुख दोष भी हैं, वे अनावश्यक चर का चयन करते हैं क्योंकि वे चर के बीच संबंधों पर विचार नहीं करते हैं।

रैपर विधि द्वारा कितनी विशेषताओं का चयन किया जाएगा?

इसे सभी संभावित फीचर सबसेट के स्थान के एक ह्यूरिस्टिक खोज दृष्टिकोण के रूप में देखें। परिभाषा के अनुसार, "एक रैपर विधि सुविधाओं के एक सबसेट का मूल्यांकन करती है, इस प्रकार यह सुविधाओं के बीच बातचीत को ध्यान में रखती है।"

उदाहरण: पहाड़ी चढ़ाई, यानी एक समय में सुविधाओं जोड़ने रखना जब तक कि कोई आगे सुधार प्राप्त किया जा सकता

जब से हम 50 विशेषता है जो सबसे जानकारी नहीं है, अन्य 50 की एक प्रति है। पूर्व और 900 फीचर या कोई उपयोग नहीं है। इसलिए, हमें केवल 50 विशेषताएं मिलती हैं।

संबंधित मुद्दे