2010-10-04 10 views
6

मैं एक शब्द भी क्रिया या स्त्रीलिंग है या यह दोनोंस्टैनफोर्ड पार्सर में संज्ञा और क्रिया खोजने

उदाहरण के लिए है कि क्या खोजने की जरूरत है, शब्द "खोज" यह दोनों संज्ञा और क्रिया हो सकता है, लेकिन स्टैनफोर्ड पार्सर देता है एनएन टैग ..

क्या कोई तरीका है कि स्टैनफोर्ड पार्सर "खोज" दोनों संज्ञा और क्रिया दोनों को देगा?

कोड है कि मैं अब

public static String Lemmatize(String word) { 
    WordTag w = new WordTag(word); 
    w.setTag(POSTagWord(word)); 
    Morphology m = new Morphology(); 
    WordLemmaTag wT = m.lemmatize(w); 

    return wT.lemma(); 
} 

का उपयोग करें या मैं किसी अन्य सॉफ्टवेयर का उपयोग यह करने के लिए करना चाहिए? कृपया मुझे अग्रिम में धन्यवाद

उत्तर

8

स्टैनफोर्ड पार्सर संदर्भ आंकड़ों के आधार पर एक शब्द का अंश-भाषण टैग अनुमान लगाता है। आपको यह निर्धारित करने के लिए वास्तव में एक पूर्ण वाक्य में गुजरना चाहिए कि, उस वाक्य में, "खोज" एक संज्ञा या क्रिया है।

आपको भाषण के अंश प्राप्त करने के लिए केवल एक पूर्ण पार्सर की आवश्यकता नहीं है। Stanford POS Tagger पर्याप्त है; इसमें Morphology वर्ग भी शामिल है, लेकिन यह भी खाते में संदर्भ लेता है।

यदि आप सभी भाग-का-भाषण टैग जो एक अंग्रेजी शब्द संदर्भ के बिना ले सकते हैं, तो WordNet शायद बेहतर विकल्प है। इसमें कई जावा इंटरफेस हैं, जिनमें JWNL और JWI शामिल हैं।

1

स्टैनफोर्ड पार्सर वाक्य के संदर्भ में शब्दों का विश्लेषण करता है। किसी भी वाक्य में "खोज" के अपने उदाहरण का उपयोग करने के लिए, "खोज" एक संज्ञा या क्रिया होगी, लेकिन एक ही वाक्य में संज्ञा और क्रिया दोनों नहीं।

जो आप खोज रहे हैं वह एक शब्दकोश है। मुझे कई ऑनलाइन शब्दकोश मिल गए हैं जो आपको वह जानकारी देंगे जो आप खोज रहे हैं। "खोज" शब्द के लिए Free Online Dictionary से एक उदाहरण यहां दिया गया है।

यह पता चला है कि "खोज" एक संज्ञा, क्रिया, अक्रियात्मक क्रिया, और संक्रमणीय क्रिया हो सकती है।

मुझे एक एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (एपीआई) नहीं मिला जो आपको मुफ्त ऑनलाइन शब्दकोश वेब पेज पर मिलने वाली समान जानकारी प्रदान करेगा। यदि आपकी शब्दावली सूची सीमित है, तो आप अपना खुद का एपीआई बना सकते हैं।

+1

वर्डनिक के लिए एक एपीआई है जो मूल रूप से प्रदान करेगा: http://www.wordnik.com/developers – ealdent

+0

लिंक ढूंढने के लिए धन्यवाद। –

3

WordNet जो आप चाहते हैं वह है। यह एक अंग्रेजी लेक्सिकॉन के लिए एक एपीआई प्रदान करता है जिसमें संभवतः भाषण, समानार्थी शब्द, शब्द इंद्रियां, हाइपरनेम/हाइपोनिक संबंध और अधिक शामिल हैं।

एक महान शुद्ध-जावा वर्डनेट एपीआई के लिए Yawni देखें।

संबंधित मुद्दे