lemmatization

6गर्मी

2उत्तर

टेक्स्ट का विश्लेषण करें (लेमैमैटिज़ेशन, दूरी संपादित करें)

मुझे प्रतिबंधित शब्दों में मौजूद टेक्स्ट का विश्लेषण करने की आवश्यकता है। मान लीजिए कि काला सूची शब्द है: "फोर्बिड"। शब्द में कई रूप हैं। पाठ में शब्द हो सकता है, उदाहरण के लिए: "मना कर रहा है", "वर्ज

75गर्मी

7उत्तर

lemmatization बनाम stemming के बीच सही अंतर क्या है?

मैं प्रत्येक का उपयोग कब करूं? भी ... एनएलटीके लेमैमैटेशन भाषण के हिस्सों पर निर्भर है? यदि यह था तो यह अधिक सटीक नहीं होगा?

7गर्मी

1उत्तर

कुशल लेमेटाइज़र जो डिक्शनरी लुकअप से बचाता है

मैं 'खाने' से 'खाने', 'खाती' जैसी स्ट्रिंग को कन्वर्ट करना चाहता हूं। मैंने समाधान के रूप में lemmatization की खोज की और पाया, लेकिन सभी lemmatizer उपकरण जो मैं आया है शब्द सूची या शब्दकोश-लुकअप का उप

5गर्मी

2उत्तर

एक लेमैमाइज़र बनाना: स्पीड ऑप्टिमाइज़ेशन

मैं अजगर में एक लेमैमाइज़र बना रहा हूं। जैसा कि मुझे रीयलटाइम/प्रक्रिया में चलाने की आवश्यकता है, डेटा की काफी बड़ी मात्रा प्रसंस्करण गति सार का है। डेटा: मेरे पास सभी संभावित प्रत्यय हैं जो सभी शब्दा

6गर्मी

1उत्तर

एनएलटीके

में अनियंत्रित पाठ को स्टेमिंग करना मैंने रेगेक्स स्टेमर की कोशिश की, लेकिन मुझे सैकड़ों असंबद्ध टोकन मिलते हैं। मुझे बस "प्ले" स्टेम में दिलचस्पी है। यहां कोड है जिसके साथ मैं काम कर रहा हूं: import

39गर्मी

5उत्तर

पाइथन

में वर्डनेट लेमैमैटिज़ेशन और पॉज़ टैगिंग मैं पाइथन में वर्डनेट लेमैमाइज़र का उपयोग करना चाहता था और मैंने सीखा है कि डिफ़ॉल्ट पॉज़ टैग एनओएनएन है और यह एक क्रिया के लिए सही लेम्मा आउटपुट नहीं करता है,

17गर्मी

2उत्तर

Lemmatize फ्रेंच पाठ

मैं फ्रेंच में कुछ पाठ है कि मैं कुछ मायनों में कार्रवाई करने के लिए की जरूरत है। कि के लिए, मैं करने की जरूरत है: पहले, शब्द में पाठ फिर उन शब्दों lemmatize tokenize एक ही रूट एक बार से अधिक प्रसंस्क