2010-09-23 14 views
13

मैं वाक्यों के विश्लेषण के लिए एक जावा संचालित समाधान की तलाश कर रहा हूं ताकि यह लॉग इन किया जा सके कि एक महत्वपूर्ण शब्द सकारात्मक या नकारात्मक रूप से उपयोग किया गया था या नहीं।जावा टेक्स्ट विश्लेषण पुस्तकालय

Ie कुंजी शब्द 'पत्तागोभी' और वाक्य हो सकता है: -

'मैं पत्तागोभी लेकिन पसंद नहीं मटर'

और मैं किसी तरह के रूप में इस लॉग इन करने की एक जावा पाठ विश्लेषक करना चाहते हैं सकारात्मक। क्या इसके लिए ल्यूसीन (हाइबरनेट-सर्च) पुस्तकालयों का उपयोग किया जा सकता है?

कोई विचार?

उत्तर

16

आप "भावना विश्लेषण" की तलाश में हैं। एक संभावना LingPipe है, जो कृपया link to their competitors also है। जेफ डाल्टन में his blog में प्राकृतिक भाषा प्रसंस्करण औजारों की एक बड़ी सूची भी है।

+1

यहां सामानों की एक संपत्ति है। इसमें कुछ समय निकालने जा रहा है। मैं अपने निष्कर्षों पर वापस रिपोर्ट करूंगा - लेकिन पॉइंटर्स के लिए बहुत धन्यवाद। – jaseFace

+0

हां, अगर आपको कुछ उपयोगी लगता है तो कृपया रिपोर्ट करें। – ishnid

0

Mahout Taste पर एक नज़र डालें, जो ल्यूसीन पर बनाता है लेकिन आपको बॉक्स से बाहर की बहुत सारी चीज़ें जोड़ती है। (संपादित करें) मुझे जोड़ना चाहिए, Mahout स्वाद केवल संबंधित है जो आप खोज रहे हैं और 100% मैच नहीं है।

+3

(मैं लेखक हूं।) स्वाद एक सहयोगी फ़िल्टरिंग इंजन है। Encapsulating परियोजना, Mahout, अधिक सामान्य डेटा खनन से संबंधित है, लेकिन भावना विश्लेषण शामिल नहीं है। –

1

मुझे संदेह है कि ऐसा कुछ भी है। ल्यूसीन निश्चित रूप से बॉक्स से बाहर नहीं कर सकता है।

आप कैसे परिभाषित करते हैं कि "क्या एक महत्वपूर्ण शब्द सकारात्मक या नकारात्मक रूप से उपयोग किया गया था" जिस तरह से प्रोग्रामेटिक रूप से मूल्यांकन किया जा सकता है? इसे सही तरीके से करने के लिए, आपको टेक्स्ट को उनके वास्तविक अर्थ के लिए विश्लेषण करना होगा, जो एक एआई समस्या है जिसे दूरस्थ रूप से हल नहीं किया गया है।

मुझे लगता है कि आप केवल सांख्यिकीय विश्लेषण करके इसे हल कर सकते हैं कि कीवर्ड सकारात्मक (जैसे, अच्छा, महान, अद्भुत) या नकारात्मक (बुरा, घृणा, क्रोधित, हानिकारक) कीवर्ड के करीब दिखाई देता है, लेकिन यहां तक ​​कि, अस्वीकृति, कटाक्ष और जटिल वाक्य संरचनाएं समस्याग्रस्त हो जाएंगी।

+0

मुझे एक अनुवादक की याद दिलाई गई है जो "आत्मा तैयार है, लेकिन मांस कमजोर है" के साथ शुरू हुआ, और "शराब अच्छा है, लेकिन मांस सड़ा हुआ है" के साथ वापस आया। –

संबंधित मुद्दे