2012-10-13 16 views
5

मुझे वजन के साथ सकारात्मक और नकारात्मक शब्दों की एक सूची की आवश्यकता है, जो कि कितने मजबूत और सप्ताह के अनुसार शब्दों को सौंपा गया है। मुझे मिल गया है:भावना विश्लेषण - wordNet, sentiWordNet lexicon

1.) वर्डनेट - यह प्रत्येक शब्द के लिए + या स्कोर देता है।

2.) SentiWordNet - सीमा [0,1] में सकारात्मक और नकारात्मक मूल्य प्रदान करना।

मैं कुछ शब्द पर इन जाँच की,

प्यार - WordNet, दोनों संज्ञा और क्रिया के लिए 0.0 दे रहा है मैं जानता हूँ कि क्यों मुझे लगता है कि यह कम से कम कुछ पहलू से सकारात्मक होना चाहिए न।

दबाने - wordNet देता है -9.93
- SentiWordNet देता है - 0.0 दोनों pos और neg के लिए। (नकारात्मक होना चाहिए)

विश्राम - WordNet - 2.488
- SentiWordNet - {स्थिति - 0.125, बातचीत और विवाद - 0.5} (सकारात्मक होना चाहिए)

मैं जो एक का उपयोग करने का फैसला करने के लिए कुछ मदद की जरूरत है।

धन्यवाद।

+0

वह जो बेहतर परिणाम देता है। :-) – Reactormonk

+3

वर्डनेट से आपको सकारात्मक नकारात्मक स्कोर कहां मिला? – justhalf

उत्तर

2

अक्सर डिग्री और/या ध्रुवीयता डोमेन और/या संदर्भ पर निर्भर हो सकती है, इसलिए अकेले शब्द निर्णय लेने के लिए वास्तव में पर्याप्त नहीं है।

यदि आपके पास कुछ एनोटेटेड डेटा है, तो मैं सुझाव देता हूं कि दो संसाधनों द्वारा प्रदान किए गए स्कोर का उपयोग करके क्लासिफायर को प्रशिक्षण दें। यदि आप नहीं करते हैं, तो एक विकल्प उपलब्ध भावना-एनोटेटेड निगम का उपयोग करना है जो प्रश्न में डोमेन से मेल खाता है। पूरे पूरे कार्य में किसी भी डेटा के बिना कुछ हद तक मुश्किल हो जाता है, हालांकि भावना वर्गीकरण के लिए असुरक्षित दृष्टिकोण पर काम का एक बड़ा हिस्सा है, मुझे विश्वास है, देखें, उदा। Unsupervised Sentiment Analysis

+0

संदर्भ/डोमेन के बारे में, मुझे लगता है कि अगर किसी शब्द में अलग भावना होती है तो यह एक अलग वर्डनेट भावना होनी चाहिए। जैसे प्यार # 5 (टेनिस डोमेन) बनाम अन्य अर्थों http://sentiwordnet.isti.cnr.it/search.php?q=love पर क्या आपके पास एक प्रति-उदाहरण है जहां विभिन्न शब्द में एक शब्द का अलग अर्थ हो सकता है लेकिन इसका अपना वर्डनेट अर्थ नहीं हो सकता है? –

1

, SentiWordNet के लिए अलग राय देने के लिए एक अंतरफलक है अगर आपको लगता है कि वे गलत कर रहे हैं: http://sentiwordnet.isti.cnr.it/search.php?q=repose

मैं शब्दतंत्र 3.1 नवीनतम डाउनलोड, और file format documentation जाँच की, और भावना का कोई उल्लेख नहीं दिख रहा है जिन नंबरों का आप उल्लेख करते हैं। यह online search में भी नहीं दिखाया गया है।

तो, उन दोनों कारणों से मैं SentiWordNet के साथ जाने का सुझाव दूंगा!

(मैं देख रहा हूँ अपने प्रश्न एक साल का है, इसलिए शायद आप हमें बता सकते हैं क्या आप के साथ चले गए, और क्यों?)

-1

polarity की डिग्री न केवल शब्दों पर अकेले लेकिन यह भी निर्भर करता है पर प्रेषण या वाक्यांश का संदर्भ। SO यदि एक ही शब्द के बारे में अलग-अलग परिणाम हैं तो यह संदर्भ में अंतर के कारण है।

संबंधित मुद्दे