से नाम निकालें क्या किसी को पाठ के शरीर से केवल संज्ञा निकालने का सबसे आसान तरीका पता है?पाठ (जावा)
मैं TreeTagger tool के बारे में सुना है और मैं इसे एक शॉट देने की कोशिश की, लेकिन यह किसी कारण के लिए काम करने के लिए नहीं मिल सका।
कोई सुझाव?
धन्यवाद फिल
संपादित करें:
import org.annolab.tt4j.*; TreeTaggerWrapper tt = new TreeTaggerWrapper(); try { tt.setModel("/Nouns/english.par"); tt.setHandler(new TokenHandler() { void token(String token, String pos, String lemma) { System.out.println(token+"\t"+pos+"\t"+lemma); } }); tt.process(words); // words = list of words } finally { tt.destroy(); }
मेरी कोड है, अंग्रेजी भाषा है। मुझे त्रुटि मिल रही थी: प्रकार नया टोकन हैंडलर() {} को विरासत सार विधि TokenHandler.token को लागू करना होगा। क्या मुझसे कुछ गलत हो रही है?
मन को समझाने के लिए बिल्कुल TreeTagger साथ काम नहीं किया क्या? –
क्या आप अपनी समस्या निर्दिष्ट कर सकते हैं? विशेष रूप से भाषा जानना अच्छा लगेगा ... उदाहरण के लिए जर्मन का अच्छा फायदा है कि सभी संज्ञाओं में पहला अक्षर पूंजीकृत है। – Chris
मैं ट्रीटागर एपीआई से परिचित नहीं हूं लेकिन मैं सेटहैंडलर() के बाहर टोकनहैंडलर को तुरंत चालू करके शुरू करूंगा - जो एक स्पष्ट संदेश दे सकता है। मेरा अनुमान है कि टोकनहैंडलर अमूर्त है लेकिन ... –