फ़ारसी के लिए एनएलटीके के कार्यों का उपयोग कैसे करें?फ़ारसी के लिए एनएलटीके
उदाहरण के लिए: 'समन्वय'। जब मैं 'समन्वय' का उपयोग करता हूं, तो जवाब 'मेल नहीं खाता' है, हालांकि मेरे पाठ में समन्वय का पैरामीटर है।
इनपुट बहुत सरल है। इसमें "हैलो سلام" शामिल है। जब 'कॉन्सर्डेंस' का पैरामीटर 'हैलो' है तो जवाब सही है, लेकिन, अगर यह 'سلام' है तो जवाब 'मिलान नहीं है'। मेरे लिए आउटपुट '1 मैचों में से 1 प्रदर्शित करना' है। https://github.com/sobhe/hazm
उपयोग::
import nltk
from urllib import urlopen
url = "file:///home/.../1.html"
raw = urlopen(url).read()
raw = nltk.clean_html(raw)
tokens = nltk.word_tokenize(raw)
tokens = tokens[:12]
text = nltk.Text(tokens)
print text.concordance('سلام')
क्या आप न्यूनतम कोड उदाहरण और आपके द्वारा किए गए प्रयासों के न्यूनतम इनपुट उदाहरण दे सकते हैं, और क्या आप होने की उम्मीद है? – jogojapan