मेरा लक्ष्य भावनात्मक सामग्री के लिए कुछ कॉर्पस (अब के लिए ट्विटर) का विश्लेषण करना है। बस आज मुझे एहसास हुआ कि भावनात्मक शब्द उपभेदों की एक विस्तृत सूची होने के विरोध में शब्द उपभेदों की खोज करने के लिए थोड़ा सा अर्थ होगा। और इसलिए मैं केवल यह समझने के लिए nltk.stem की खोज कर रहा हूं कि 4 अलग-अलग स्टेमर्स हैं। मैं स्टैक ओवरफ्लो भाषाविदों से पूछना चाहता हूं कि क्या लंकास्टरस्टेमर, पोर्टरस्टेमर, रेगेक्सपेस्टमेर, आरएसएलपीएसटेमेर, या वर्डनेट स्टेमर कुछ औचित्य के साथ सबसे अच्छा है।एनएलटीके में मुझे किस शब्द स्टेमर का उपयोग करना चाहिए?
उत्तर
आरएसएलपी पोर्तुगीज के लिए है। मुझे लगता है कि आप अंग्रेजी चाहते हैं। Regexp आपको अपने स्वयं के स्मारक अभिव्यक्तियों को विकसित करने की आवश्यकता होगी, इसलिए मुझे लगता है कि इसे भी अनदेखा किया जा सकता है। WordnetStemmer की आवश्यकता है कि आप शब्द के लिए भाषण के बारे में जानते हों, इसलिए इसे उपयोग करने के लिए आपको पहले पॉज़ टैगिंग करना होगा। मैंने पोर्टर स्टेमिंग एल्गोरिदम का उपयोग किया है और यह बहुत अच्छा है, लेकिन लंकास्टर एल्गोरिदम नया है, इसलिए यह बेहतर हो सकता है। आप स्टेमर्स के संयोजन का उपयोग करने का प्रयास करना चाह सकते हैं, जहां आप प्रत्येक स्टेमर से सबसे छोटा स्टेम चुनते हैं। वैसे भी, नीचे की रेखा यह है कि पोर्टरस्टेमर एक अच्छी डिफ़ॉल्ट पसंद है।
यह आपके से पूछने से थोड़ा अलग हो सकता है, लेकिन नोडबॉक्स लिंगस्टिक्स लाइब्रेरी में is_emotive() फ़ंक्शन शामिल है जो यह देखने के लिए शब्दों को जांचता है कि वे कुछ भावनात्मक शब्दों के पुनरावर्ती hyponyms हैं या नहीं। commonsense.py
ekman = ["anger", "disgust", "fear", "joy", "sadness", "surprise"]
other = ["emotion", "feeling", "expression"]
नहीं स्टेमर, लेकिन एक दिलचस्प दृष्टिकोण से बाहर की जाँच करने के लिए।
- 1. मुझे किस पायथन का उपयोग करना चाहिए?
- 2. मुझे किस डीबी का उपयोग करना चाहिए?
- 3. मुझे किस प्रकार का संग्रह उपयोग करना चाहिए?
- 4. सीएसएस में मुझे किस कोटेशन मार्क का उपयोग करना चाहिए?
- 5. वीआईएम में मुझे किस मोड़ का उपयोग करना चाहिए?
- 6. स्नोबॉल स्टेमर केवल अंतिम शब्द
- 7. मुझे किस फ्लोटिंग-पॉइंट छवि प्रारूप का उपयोग करना चाहिए?
- 8. मुझे किस जावास्क्रिप्ट रिपोजिटरी का उपयोग करना चाहिए?
- 9. गुई टूलकिट, मुझे किस का उपयोग करना चाहिए?
- 10. मुझे किस चेकसम एल्गोरिदम का उपयोग करना चाहिए?
- 11. मुझे किस पर्ल डेटाबेस इंटरफ़ेस का उपयोग करना चाहिए?
- 12. मुझे किस कोड का उपयोग करना चाहिए, CodeContract या CuttingEdge.Conditions?
- 13. मुझे किस स्क्रीन रिज़ॉल्यूशन का उपयोग करना चाहिए?
- 14. मुझे किस दस्तावेज़म एपीआई का उपयोग करना चाहिए?
- 15. enum या परिभाषित, मुझे किस का उपयोग करना चाहिए?
- 16. ओएथ/ओपनआईडी - मुझे किस का उपयोग करना चाहिए?
- 17. मुझे किस पायथन स्थापना का उपयोग करना चाहिए?
- 18. मुझे किस ओपनएसएल का संस्करण उपयोग करना चाहिए?
- 19. मुझे किस वीएमवेयर एपीआई का उपयोग करना चाहिए?
- 20. मुझे किस नियम इंजन का उपयोग करना चाहिए?
- 21. लगातार बनाम गैर-निरंतर - मुझे किस का उपयोग करना चाहिए?
- 22. मुझे किस डक्ट टाइप का उपयोग करना चाहिए?
- 23. मुझे किस ग्रहण सबवर्जन प्लगइन का उपयोग करना चाहिए?
- 24. मुझे किस गेम इंजन का उपयोग करना चाहिए?
- 25. मुझे GC.SuppressFinalize() का उपयोग कब करना चाहिए?
- 26. क्या मुझे jQuery.each() का उपयोग करना चाहिए?
- 27. क्या मुझे jQuery.inArray() का उपयोग करना चाहिए?
- 28. मुझे किस निर्भरता को इंजेक्ट करना चाहिए?
- 29. रिकॉर्ड को संग्रहीत करने के लिए मुझे किस डेटाबेस का उपयोग करना चाहिए, और मुझे इसका उपयोग कैसे करना चाहिए?
- 30. मुझे क्या gacutil.exe का उपयोग करना चाहिए?