2009-07-04 23 views
7

ऐसा प्रतीत होता है कि मूल भावना विश्लेषण करने का सबसे सरल, बेवकूफ तरीका बेयसियन वर्गीकरण (जिसे मैं यहां पर खोज रहा हूं) द्वारा पुष्टि की गई है। कोई काउंटर-तर्क या अन्य सुझाव?सरल भावना विश्लेषण

उत्तर

11

शब्द प्रतिनिधित्व के एक बैग के साथ एक बेयसियन वर्गीकृत सबसे सरल सांख्यिकीय विधि है। अधिक जटिलता की लागत पर, आप अधिक उन्नत क्लासिफायर और फीचर प्रतिनिधित्व पर जाकर काफी बेहतर परिणाम प्राप्त कर सकते हैं।

सांख्यिकीय विधियां शहर में एकमात्र गेम नहीं हैं। नियम आधारित विधियां जिनके पास पाठ की संरचना की अधिक समझ है, वे अन्य मुख्य विकल्प हैं। मैंने जो देखा है, उससे वास्तव में सांख्यिकीय विधियों को भी नहीं किया जाता है।

मैं मैनिंग और श्त्ज़ की सांख्यिकीय प्राकृतिक भाषा प्रसंस्करण अध्याय 16, पाठ वर्गीकरण की नींव की अनुशंसा करता हूं।

5

मैं भावनात्मक विश्लेषण करने के लिए एक सरल, अधिक बेवकूफ तरीका नहीं सोच सकता, लेकिन आप नैवे बेयस के बजाय एक समर्थन वेक्टर मशीन का उपयोग करने पर विचार कर सकते हैं (कुछ मशीन लर्निंग टूलकिट में, यह एक ड्रॉप-इन प्रतिस्थापन हो सकता है) । "Thumbs up? Sentiment Classification using Machine Learning Techniques" by Bo Pang, Lillian Lee, and Shivakumar Vaithyanathan पर एक नज़र डालें जो इन तकनीकों पर सबसे शुरुआती कागजात में से एक था, और संबंधित तकनीकों के परिवार पर सटीकता के परिणामों की एक अच्छी तालिका देता है, जिनमें से कोई भी अन्य किसी भी की तुलना में अधिक जटिल (ग्राहक परिप्रेक्ष्य से) नहीं है।

+0

यह एक अच्छी शुरुआत है। बाद में, बेहतर परिणाम प्राप्त करने के लिए, पांग एंड ली के पास समस्या का सामना करने वाला एक और पेपर थोड़ा अलग था। इसे आज़माएं: http://www.aclweb.org/anthology-new/P/P04/P04-1035.pdf – mixdev

1

बिल्डिंग ऊपर केन द्वारा प्रदान की जवाब पर, एक और कागज है

"भावना विश्लेषण विविध जानकारी स्रोतों के साथ समर्थन वेक्टर मशीनों का उपयोग कर" टोनी और नाइजर से,

जो सिर्फ से अधिक सुविधाएँ बताए पर लग रहा है पांग और ली द्वारा उपयोग किए जाने वाले शब्दों का एक बैग। यहां, वे विशेषण के अर्थपूर्ण भेदभाव को निर्धारित करने के लिए वर्डनेट का लाभ उठाते हैं, और पाठ में विषय की ओर भावना की निकटता, एसवीएम के लिए अतिरिक्त सुविधाएं के रूप में। वे भावनाओं के आधार पर पाठ वर्गीकृत करने के पिछले प्रयासों के मुकाबले बेहतर परिणाम दिखाते हैं।

संबंधित मुद्दे