चूंकि बड़े वेब अनुप्रयोग अस्तित्व में आए, डेटा की खोज (और इसे तेज और सटीक बिजली करना) वेब अनुप्रयोगों में सबसे महत्वपूर्ण समस्याओं में से एक रहा है। थोड़ी देर के लिए, मैंने Lucene.NET का उपयोग करके काम किया है, जो Lucene project का सी # पोर्ट है।एनएलपी प्रोग्रामिंग उपकरण?
मैं Zend Framework's Lucene API का उपयोग करके PHP का उपयोग करके भी काम करता हूं, जो मुझे मेरे प्रश्न पर लाता है। अच्छा अनुक्रमण हम tokenizing, lemmatizing, और कई और अधिक जैसे कुछ NLP उपकरण प्रदर्शन करने की जरूरत है प्रदान करने के लिए कई बार, सवाल यह है:
आप किसी भी अच्छा NLP प्रोग्रामिंग ढांचे/टूलसेट PHP का उपयोग का पता है?
पीएस: मुझे ल्यूसीन के लिए ज़ेंड एपीआई के बारे में बहुत जानकारी है, लेकिन डेटा को अनुक्रमणित करना सिर्फ ल्यूसीन में ही भंडारण और भरोसा नहीं है, आपको ऊपर दिए गए कुछ अतिरिक्त कार्य करने की आवश्यकता है।
हाँ, मैं इसके बारे में पता है, और मैं इसका इस्तेमाल, लेकिन मेरे NLP उपकरण जहां के बारे में किसी भी टोकननाइज़र, नाम पार्सर्स या कुछ ऐसा ढूंढना। मैं वैसे भी सवाल संपादित करूंगा, क्योंकि शायद पर्याप्त स्पष्ट नहीं है। –
@ डेविड: मैंने अपने जवाब में और जोड़ा; लुसीन वास्तव में टोकननाइज़ और लेमैमैटिज़ कर सकते हैं। – Xodarap
मैं लुसीन की क्षमताओं के बारे में भी जानता हूं, लेकिन आप जावा मूल प्रोजेक्ट पर संकेत दे रहे हैं और मुझे लगता है कि ज़ेंड पोर्ट में उन्हें शामिल नहीं किया गया है, इसलिए मैं अभी भी वही हूं। वैसे भी –