2011-02-01 13 views
8

मुझे आश्चर्य है कि क्या एक बेयस क्लासिफायर एक एप्लिकेशन के लिए समझ में आता है, जहां कुछ चीजें "बियर, सोडा) से जुड़ी" अच्छी "होती है, लेकिन" चीजें "होती है लेकिन अन्य चीजों से संबंधित" बुरा " स्टेक, पिज्जा, बर्गर)?सोच रहा है कि क्या बेयस क्लासिफायर सही दृष्टिकोण है?

मैं क्या सोच रहा हूं कि एक बेयस क्लासिफायरफायर प्रशिक्षण ("बियर सर्दी" और "सोडा ठंडा" "अच्छा" है) प्रशिक्षण को रद्द कर देता है कि "स्टेक सर्दी परोसता है" और "बर्गर सर्दी परोसता है" खराब है ")।

या, बेयस (सही ढंग से) प्रशिक्षित किया जा सकता है कि "ठंडा" हो सकता है कि यह "अच्छा" या "बुरा" हो सकता है, जो इसके साथ जुड़ा हुआ है?

मुझे बेयस पर और यहां कहीं और अच्छी जानकारी मिली, लेकिन यह निर्धारित करने में असमर्थ था कि यह इस प्रकार के एप्लिकेशन के लिए उपयुक्त है, जहां एक वाक्यांश का उत्तर अच्छा या बुरा है "यह निर्भर करता है"?

+0

, btw, हम संज्ञाओं की एक अपेक्षाकृत छोटी संख्या है (100 से कम) और विशेषण के एक अपेक्षाकृत छोटी संख्या (50) इसलिए हम खुशी से अच्छे/बुरे संयोजनों की एक पूरी तरह से पूर्ण संरचना को परिभाषित कर सकते हैं ... लेकिन यह सुनिश्चित नहीं है कि किस प्रकार का वैकल्पिक 'स्कोरिंग इंजन' छोटे संदेश को स्कोर करने की अनुमति देगा। – jpwynn

उत्तर

6

Naive Bayes classifier गुणों के बीच स्वतंत्रता मानता है। उदाहरण के लिए, मान लें कि आपके निम्न डेटा है:

सेब फल लाल खराब
सेब फल हरे रंग खराब
केले के फल पीले अच्छा
टमाटर सब्जी लाल अच्छा

स्वतंत्रता का मतलब है कि गुण (नाम, फल, रंग) स्वतंत्र हैं; उदाहरण के लिए, "सेब" या तो "फल" या "सब्जी" हो सकता है। इस मामले में गुण "नाम" और "फल" निर्भर हैं इसलिए एक बेवकूफ बेयस वर्गीकृत बहुत बेवकूफ है (यह संभवतः "सेब फल पीले" को बीएडी के रूप में वर्गीकृत करेगा क्योंकि यह एक सेब है और यह एक फल है - लेकिन सभी सेब नहीं हैं फल?)।

अपने मूल प्रश्न का उत्तर देने के लिए, एक बेवकूफ बेयस क्लासिफ़ेर मानता है कि कक्षा (अच्छा या बीएडी) प्रत्येक विशेषता पर स्वतंत्र रूप से निर्भर करती है, जो मामला नहीं है - मुझे अपने पिज्जा को गर्म और मेरा सोडा ठंडा पसंद है।

संपादित करें: यदि आप एक वर्गीकरण की तलाश में हैं जिसमें कुछ उपयोगिता है लेकिन सिद्धांत में कई प्रकार I और टाइप II त्रुटियां हो सकती हैं, तो बेव बेस इस तरह के वर्गीकृत हैं। बेवकूफ बेयस कुछ भी नहीं है, लेकिन कम बेवकूफ वर्गीकरण का उपयोग करने में मापनीय मूल्य है।

+0

महान स्पष्टीकरण और उत्तर! धन्यवाद!!! – jpwynn

+1

खेद है लेकिन वोट दिया गया। जबकि यह सच है कि बेवकूफ बेय गुणों के बीच आजादी मानते हैं (इसलिए इसे बेवकूफ कहा जाता है), व्यावहारिक रूप से यह वास्तविक समस्या नहीं है। बड़ा उदाहरण स्पैम फ़िल्टर है जो बहुत अच्छा काम करता है, भले ही ईमेल में शब्द अत्यधिक एक दूसरे पर निर्भर हैं –

+0

प्रतिक्रिया के लिए धन्यवाद। मैं बेवकूफ बेयस को खारिज कर देता हूं क्योंकि इसके परिणामस्वरूप मुझे अधिक प्रकार के I और टाइप II त्रुटियों का परिणाम मिलेगा जो मुझे उपयुक्त लगेगा। – Daniel

2

मैं बेयस को जितनी जल्दी डैनियल के सुझाव के रूप में खारिज नहीं करता। बेयस की गुणवत्ता (गणित-बोलने में प्रदर्शन) सभी के ऊपर प्रशिक्षण डेटा की मात्रा और गुणवत्ता पर निर्भर करता है, और जब आप अपना एल्गोरिदम विकसित करते हैं तो आपके द्वारा किए गए अनुमानों पर निर्भर करता है।

आपको एक छोटा सा उदाहरण देने के लिए, यदि आप इसे केवल '' बियर सर्दी '=>: अच्छा,' पिज्जा ठंडा '=>: खराब} शब्द' ठंडा 'वास्तव में वर्गीकरण को प्रभावित नहीं करेंगे। यह तय करेगा कि सभी बीयर अच्छे हैं और सभी पिज्जा खराब हैं (देखें कि यह कितना स्मार्ट है? :))

वैसे भी, उत्तर विस्तार से यह बताने के लिए बहुत छोटा है, मैं पॉल ग्राहम के निबंध को कैसे पढ़ता हूं उन्होंने अपना स्पैम फ़िल्टर विकसित किया - ध्यान दें कि उन्होंने बेयस के आधार पर अपना स्वयं का एल्गोरिदम बनाया है और न केवल शेल्फ वर्गीकृत है। मेरे (अब तक कम) अनुभव में ऐसा लगता है कि आप विशिष्ट समस्या के लिए एल्गोरिदम के विशिष्ट संस्करण को विकसित करने में उसके पीछे बेहतर हैं ताकि आपके पास विभिन्न डोमेन विशिष्ट धारणाओं पर नियंत्रण हो।

तुम मेरे प्रयास (माणिक में) का पालन कर सकते हैं यहां अगर आप रुचि रखते हैं: http://arubyguy.com/2011/03/03/bayes-classification-update/

हमारे आवेदन में
संबंधित मुद्दे