2011-03-19 18 views
15

मेरे पास पीओएस ने nltk.pos_tag() के साथ कुछ शब्द टैग किए हैं, इसलिए उन्हें पेड़बैंक टैग दिए गए हैं। मैं ज्ञात पीओएस टैग का उपयोग करके इन शब्दों को लेमैटिज़ करना चाहता हूं, लेकिन मुझे यकीन नहीं है कि कैसे। मैं वर्डनेट लेमैमाइज़र को देख रहा था, लेकिन मुझे यकीन नहीं है कि पेड़बैंक द्वारा स्वीकार किए गए टैग में पेड़बैंक पीओएस टैग को कैसे परिवर्तित किया जाए। मैं इस रूपांतरण को आसानी से कैसे कर सकता हूं, या क्या कोई लेमैमाइज़र है जो पेड़बैंक टैग का उपयोग करता है?LLmatizing पीओएस एनएलटीके के साथ टैग किए गए शब्द?

+3

मैं 'गुस्से में स्थिति' – fizzer

+1

के रूप में इस पढ़ा कुछ संकेत भी यहां उपलब्ध हैं http://stackoverflow.com/questions/15586721/wordnet-lemmatization-and-pos-tagging-in-python – Sadik

उत्तर

28

वर्डनेट लेमैमाइज़र केवल भाषण के चार हिस्सों (एडीजे, एडीवी, एनओएनएन, और वीईआरबी) को जानता है और केवल एनओयूएन और वीईआरबी नियम कुछ भी विशेष रूप से दिलचस्प करते हैं। पेड़बैंक टैगसेट में भाषण के संज्ञा भागों सभी एनएन के साथ शुरू होते हैं, क्रिया टैग सभी वीबी के साथ शुरू होते हैं, विशेषण टैग जे जे के साथ शुरू होते हैं, और adverb टैग आरबी के साथ शुरू होते हैं। तो, लेबल में से एक सेट से दूसरे में परिवर्तित करने के बहुत आसान है, कुछ की तरह:

from nltk.corpus import wordnet 

morphy_tag = {'NN':wordnet.NOUN,'JJ':wordnet.ADJ,'VB':wordnet.VERB,'RB':wordnet.ADV}[penn_tag[:2]] 
+0

उपग्रह विशेषणों के बारे में क्या? – user1048677

+0

सैटेलाइट विशेषण नियमित विशेषण के समान माना जाता है। – rmalouf

+0

[penn_tag] कहां से खींचता है? ट्रीबैंक टैग की सूची? – Ksofiac

संबंधित मुद्दे