ठीक है, मुझे हाल ही में प्राकृतिक भाषा प्रसंस्करण में बहुत रुचि है: हालांकि, मैंने अपने अधिकांश काम के लिए अब तक सी का उपयोग किया है। मैंने एनएलटीके के बारे में सुना, और मुझे पायथन नहीं पता था, लेकिन यह सीखना काफी आसान लगता है, और यह वास्तव में शक्तिशाली और रोचक भाषा की तरह दिख रहा है। विशेष रूप से, एनएलटीके मॉड्यूल बहुत कुछ लगता है, जो मुझे करने की ज़रूरत है, उससे बहुत अनुकूल है।एनएलटीके प्रदर्शन
हालांकि, sample code for NLTK का उपयोग करते समय और test.py
नामक फ़ाइल में पेस्ट करते हुए, मैंने देखा है कि इसे चलाने में बहुत लंबा समय लगता है!
मैं खोल से फोन कर रहा हूँ तो जैसे:
time python ./test.py
और रैम की 4 GB का साथ, 2.4 GHz मशीन पर, यह 19.187 सेकंड लेता है!
अब, शायद यह बिल्कुल सामान्य है, लेकिन मैं इस धारणा के तहत था कि एनटीएलके अत्यंत तेज था; मुझे गलत हो सकता है, लेकिन क्या कुछ स्पष्ट है कि मैं स्पष्ट रूप से गलत कर रहा हूं?
आपको यह धारणा कहां मिली कि एनएलटीके बेहद तेज़ है? –
'एनएलटीके 2.0 के साथ पायथन टेक्स्ट प्रोसेसिंग' के लिए अमेज़ॅन विवरण में: "जानें कि दक्षता या गति में किसी भी हानि के बिना डेटा की भारी मात्रा में आसानी से कैसे संभालना है।" (Http://www.amazon.com/Python-Text-Processing-NLTK-Cookbook/dp/1849513600)। – elliottbolzan