lemmatization

    6गर्मी

    2उत्तर

    मुझे प्रतिबंधित शब्दों में मौजूद टेक्स्ट का विश्लेषण करने की आवश्यकता है। मान लीजिए कि काला सूची शब्द है: "फोर्बिड"। शब्द में कई रूप हैं। पाठ में शब्द हो सकता है, उदाहरण के लिए: "मना कर रहा है", "वर्ज

    75गर्मी

    7उत्तर

    मैं प्रत्येक का उपयोग कब करूं? भी ... एनएलटीके लेमैमैटेशन भाषण के हिस्सों पर निर्भर है? यदि यह था तो यह अधिक सटीक नहीं होगा?

    7गर्मी

    1उत्तर

    मैं 'खाने' से 'खाने', 'खाती' जैसी स्ट्रिंग को कन्वर्ट करना चाहता हूं। मैंने समाधान के रूप में lemmatization की खोज की और पाया, लेकिन सभी lemmatizer उपकरण जो मैं आया है शब्द सूची या शब्दकोश-लुकअप का उप

    5गर्मी

    2उत्तर

    मैं अजगर में एक लेमैमाइज़र बना रहा हूं। जैसा कि मुझे रीयलटाइम/प्रक्रिया में चलाने की आवश्यकता है, डेटा की काफी बड़ी मात्रा प्रसंस्करण गति सार का है। डेटा: मेरे पास सभी संभावित प्रत्यय हैं जो सभी शब्दा

    6गर्मी

    1उत्तर

    में अनियंत्रित पाठ को स्टेमिंग करना मैंने रेगेक्स स्टेमर की कोशिश की, लेकिन मुझे सैकड़ों असंबद्ध टोकन मिलते हैं। मुझे बस "प्ले" स्टेम में दिलचस्पी है। यहां कोड है जिसके साथ मैं काम कर रहा हूं: import

    39गर्मी

    5उत्तर

    में वर्डनेट लेमैमैटिज़ेशन और पॉज़ टैगिंग मैं पाइथन में वर्डनेट लेमैमाइज़र का उपयोग करना चाहता था और मैंने सीखा है कि डिफ़ॉल्ट पॉज़ टैग एनओएनएन है और यह एक क्रिया के लिए सही लेम्मा आउटपुट नहीं करता है,

    17गर्मी

    2उत्तर

    मैं फ्रेंच में कुछ पाठ है कि मैं कुछ मायनों में कार्रवाई करने के लिए की जरूरत है। कि के लिए, मैं करने की जरूरत है: पहले, शब्द में पाठ फिर उन शब्दों lemmatize tokenize एक ही रूट एक बार से अधिक प्रसंस्क