nltk

    7गर्मी

    2उत्तर

    कोई कोरियाई, इंडोनेशियाई, थाई और वियतनामी के लिए ओपन सोर्स पीओएस टैगर की सिफारिश कर सकता है? कि मैं वर्तमान में मौजूद कॉर्पस डेटा को टैग करने के लिए उपयोग कर सकता हूं। (उदाहरण के लिए the stanford-post

    15गर्मी

    1उत्तर

    मेरे पास पीओएस ने nltk.pos_tag() के साथ कुछ शब्द टैग किए हैं, इसलिए उन्हें पेड़बैंक टैग दिए गए हैं। मैं ज्ञात पीओएस टैग का उपयोग करके इन शब्दों को लेमैटिज़ करना चाहता हूं, लेकिन मुझे यकीन नहीं है कि क

    5गर्मी

    1उत्तर

    का उपयोग कर खाता संदर्भ में लेना, मैं कठिन शब्दों के अनुवाद के साथ विदेशी भाषाओं के शिक्षार्थियों के लिए स्वचालित रूप से ग्रंथों को एनोटेट करना चाहता हूं। उदाहरण के लिए, यदि मूल पाठ है: El Gato एस्टा

    73गर्मी

    7उत्तर

    का उपयोग कर शब्द तो मैं एक डाटासेट कि मैं मैं अपने कोड के भीतर इस का उपयोग करने के बस बाहर निकालने के लिए संघर्ष कर रहा हूँ stopwords.words('english') का उपयोग करने से रोकने वाले शब्द को दूर करना चा

    6गर्मी

    2उत्तर

    में वर्डनेट चुनिंदा प्रतिबंध एनएलटीके के माध्यम से सिन्ससेट से वर्डनेट चयन संबंधी प्रतिबंधों (जैसे + एनिमेट, + मानव, आदि) को कैप्चर करने का कोई तरीका है? या क्या synset के बारे में अर्थपूर्ण जानकारी प

    5गर्मी

    1उत्तर

    मेरे पास कुछ कोड है जो मुझे टेक्स्ट में होने वाली आवृत्तियों के साथ शब्दों की एक सूची देता है, मैं इसे बनाने के लिए देख रहा हूं ताकि कोड शीर्ष 10 शब्दों को स्वचालित रूप से के साथ एआरएफएफ में परिवर्तित

    5गर्मी

    2उत्तर

    मेरे पास कुछ कोड था जो पाइथन में नियमित अभिव्यक्तियों का उपयोग करके विराम चिह्न/संख्याओं को ठीक से काम करता था, मुझे कोड को थोड़ा बदलना पड़ा ताकि एक स्टॉप सूची काम करे, विशेष रूप से महत्वपूर्ण न हो। व

    6गर्मी

    3उत्तर

    मैं पाठ मैं tokenize करना चाहते हैं के ब्लॉक है, लेकिन मैं, खाली स्थान के और विराम चिह्न पर tokenize के रूप में NLTK जैसे उपकरणों के साथ मानक प्रतीत हो रहा है नहीं करना चाहती के साथ Tokenizing। नियमित

    13गर्मी

    4उत्तर

    का उपयोग करके समानार्थी, परिभाषाएं और उदाहरण वाक्य खोजने के लिए मुझे एक शब्द के साथ एक इनपुट टेक्स्ट फ़ाइल लेने की आवश्यकता है। इसके बाद मुझे wordnet का उपयोग करके शब्द के synset के lemma_names, परिभा

    6गर्मी

    1उत्तर

    में अपने कॉर्पस बनाने के लाभ मेरे पास माइस्क्ल टेबल में बड़ी मात्रा में टेक्स्ट है। मैं कुछ सांख्यिकीय विश्लेषण करना चाहता हूं और बाद में एनएलटीके टूलकिट का उपयोग करके अपने पाठ पर कुछ एनएलपी पर करना च