क्या पाइथन 2.7 में NLTK
का उपयोग करके शब्द प्राप्त करने के लिए कोई तरीका नहीं है और अतिरिक्त प्रारूपण नहीं है जिसमें "synset"
और कोष्ठक और "n.01"
आदि शामिल हैं?पायथन एनएलटीके का उपयोग करके वर्डनेट सिंकसेट में केवल शब्द को कैसे मुद्रित किया जाए?
उदाहरण के लिए अगर मैं
wn.synsets('dog')
मेरे परिणाम कैसे दिखते हैं:
[Synset('dog.n.01'), Synset('frump.n.01'), Synset('dog.n.03'), Synset('cad.n.01'), Synset('frank.n.02'), Synset('pawl.n.01'), Synset('andiron.n.01'), Synset('chase.v.01')]
मैं कैसे बजाय इस प्रकार की सूची प्राप्त कर सकते हैं?
dog
frump
cad
frank
pawl
andiron
chase
वहाँ NLTK
का उपयोग कर ऐसा करते हैं या मैं regular expressions
उपयोग करने के लिए करने के लिए एक तरीका है? क्या मैं एक पाइथन लिपि के भीतर regular expressions
का उपयोग कर सकता हूं?
प्रति नियम के रूप में '" synset "और कोष्ठक और" n.01 "' 'frank' और' chase' का हिस्सा नहीं होना चाहिए शामिल वांछित आउटपुट? – Braj
प्रश्न से असंबंधित है लेकिन 'फ्रैंक' 'फ्रैंकफर्टर' के लिए समानार्थी/लघुरूप है जो 'हॉट डॉग' या 'कुत्ते' का समानार्थी है। इसी प्रकार 'कुत्ते' को क्रिया का अर्थ है 'पीछा करना'। – aelfric5578
मैं सूक्ष्म रूप से विडंबनात्मक रंगों को पूरा करने के लिए एक बेहद विडंबनापूर्ण विफलता देखता हूं ... – JonathanHayward