जापानी पाठ को ठीक से संभालने के लिए किस ल्यूसीन विश्लेषक का उपयोग किया जा सकता है? यह कांजी, हिरगाना, कटाकाना, रोमाजी और उनके किसी भी संयोजन को संभालने में सक्षम होना चाहिए।जापानी पाठ को संभालने के लिए किस ल्यूसीन विश्लेषक का उपयोग किया जा सकता है?
उत्तर
जबकि अपने खुद के प्रयोजनों के लिए एक खोज कर रहा lucene-gosen पाया:
उनके उदाहरण काफी सभ्य है, लेकिन मुझे लगता है कि यह बात यह है कि व्यापक परीक्षण की जरूरत है की तरह है। मैं उनकी पिछली-संगतता नीति (या बल्कि, एक की पूरी कमी के बारे में भी चिंतित हूं।)
आपको शायद CJK पैकेज पर देखना चाहिए जो ल्यूसीन के contrib क्षेत्र में है। विशेष रूप से चीनी, जापानी और कोरियाई से निपटने के लिए एक विश्लेषक और टोकननाइज़र है।
सीजेके विश्लेषक चीजों को खोजने का एक बेवकूफ तरीका प्रतीत होता है, और पिछले अनुभव से, यह बहुत प्रासंगिक नहीं लगता है खोज परिणाम। क्या सीजेके विश्लेषक कुछ वजन या कुछ संशोधित करने के लिए विशेष रूप से करने के लिए मुझे कुछ करने की ज़रूरत है? धन्यवाद –
मैंने कभी भी सीजेके विश्लेषक का उपयोग नहीं किया है, इसलिए यह नहीं कह सकता है। आप अधिक विशिष्ट सहायता के लिए लुसीन मेलिंग सूची (http://lucene.apache.org/java/docs/mailinglists.html#Java उपयोगकर्ता सूची) पर पूछने का प्रयास कर सकते हैं - ऐसे लोग हैं जो उस सूची में लुसीन के साथ बहुत अनुभवी हैं। – adrianbanks
- 1. ल्यूसीन मानक विश्लेषक अवधि
- 2. ल्यूसीन मानक विश्लेषक बनाम स्नोबॉल
- 3. वेक्टर को सॉर्ट करने के लिए किस फ़ंक्शन का उपयोग किया जा सकता है?
- 4. जापानी पाठ का HTML एन्कोडिंग
- 5. स्ट्रिंग को टोकननाइज़ करने के लिए ल्यूसीन विश्लेषक का उपयोग कैसे करें?
- 6. जो c/C++ लाइब्रेरी का उपयोग लिनक्स के लिए वाईफाई कनेक्शन को संभालने के लिए किया जा सकता है?
- 7. जावा के साथ पैराग्राफ के लिए पार्स करने के लिए किस चरित्र का उपयोग किया जा सकता है?
- 8. विक्रेता परिभाषित प्रोफाइल के लिए ब्लूटूथ यूयूआईडी का किस प्रकार उपयोग किया जा सकता है?
- 9. सीएलआईएसपी में स्क्रीन साफ़ करने के लिए किस कमांड का उपयोग किया जा सकता है?
- 10. किस उद्देश्य के लिए Django का उपयोग किया जाता है?
- 11. पर्ल नियमित अभिव्यक्तियों के खिलाफ किस वर्ग की भाषा का उपयोग किया जा सकता है?
- 12. डीबगर डिस्प्ले के साथ दिखाए गए पाठ में स्ट्रिंग स्वरूपण का उपयोग किया जा सकता है?
- 13. जापानी कांजी शब्दों को क्रमबद्ध रूप से व्यवस्थित किया जा सकता है?
- 14. गोला के बिना वैला का उपयोग किया जा सकता है?
- 15. लेखन परीक्षणों को और अधिक रोचक बनाने के लिए किस तकनीक का उपयोग किया जा सकता है?
- 16. इनलाइन असेंबलर: किस स्क्रैच रजिस्टरों का उपयोग किया जा सकता है?
- 17. नाम से संरचना चर का उपयोग करने के लिए टेम्पलेट का उपयोग किया जा सकता है?
- 18. ल्यूसीन इंडेक्स
- 19. क्या वास्तव में डेस्कटॉप एप्लिकेशन के लिए CouchDB का उपयोग किया जा सकता है?
- 20. गैर-घातक जावा समस्याओं के लिए "विंडोज त्रुटि रिपोर्टिंग" का उपयोग किया जा सकता है?
- 21. क्या Z3 का उपयोग सबस्ट्रिंग के कारण करने के लिए किया जा सकता है?
- 22. ओपनजीएल एएसजी का उपयोग gpgpu कार्यान्वयन के लिए कैसे किया जा सकता है
- 23. सॉर्ट() जापानी के लिए
- 24. जावास्क्रिप्ट पैकेज कीवर्ड का उपयोग किस लिए किया जाता है?
- 25. क्या स्कैला का उपयोग जीडब्ल्यूटी अनुप्रयोगों को लिखने के लिए किया जा सकता है?
- 26. आकार() का उपयोग सरणी लंबाई को परिभाषित करने के लिए किया जा सकता है?
- 27. सामाजिक खोज को लागू करने के लिए लोचदार खोज का उपयोग कैसे किया जा सकता है?
- 28. इटरबल इंटरफ़ेस का उपयोग किस लिए किया जाता है?
- 29. Google Analytics '__utm.gif का उपयोग किस लिए किया जाता है?
- 30. clojure.algo.generic लाइब्रेरी का उपयोग कैसे किया जा सकता है?
हमने लुसेन-गोसेन का उपयोग नहीं किया, लेकिन हमने इसका उपयोग किया। तो मैं इस जवाब को स्वीकार कर रहा हूं (क्योंकि यह काफी करीब है और परियोजना दिलचस्प लगती है)। सीजेके एक बहुत ही बेवकूफ खोज करता है जिसमें यह सिर्फ वर्णों से मेल खाता है और शब्दों को गोसेन के विपरीत नहीं (जो उचित पार्सिंग के लिए शब्दकोश का उपयोग करता है)। –