2009-10-26 9 views
8

जापानी पाठ को ठीक से संभालने के लिए किस ल्यूसीन विश्लेषक का उपयोग किया जा सकता है? यह कांजी, हिरगाना, कटाकाना, रोमाजी और उनके किसी भी संयोजन को संभालने में सक्षम होना चाहिए।जापानी पाठ को संभालने के लिए किस ल्यूसीन विश्लेषक का उपयोग किया जा सकता है?

उत्तर

3

जबकि अपने खुद के प्रयोजनों के लिए एक खोज कर रहा lucene-gosen पाया:

उनके उदाहरण काफी सभ्य है, लेकिन मुझे लगता है कि यह बात यह है कि व्यापक परीक्षण की जरूरत है की तरह है। मैं उनकी पिछली-संगतता नीति (या बल्कि, एक की पूरी कमी के बारे में भी चिंतित हूं।)

+1

हमने लुसेन-गोसेन का उपयोग नहीं किया, लेकिन हमने इसका उपयोग किया। तो मैं इस जवाब को स्वीकार कर रहा हूं (क्योंकि यह काफी करीब है और परियोजना दिलचस्प लगती है)। सीजेके एक बहुत ही बेवकूफ खोज करता है जिसमें यह सिर्फ वर्णों से मेल खाता है और शब्दों को गोसेन के विपरीत नहीं (जो उचित पार्सिंग के लिए शब्दकोश का उपयोग करता है)। –

4

आपको शायद CJK पैकेज पर देखना चाहिए जो ल्यूसीन के contrib क्षेत्र में है। विशेष रूप से चीनी, जापानी और कोरियाई से निपटने के लिए एक विश्लेषक और टोकननाइज़र है।

+0

सीजेके विश्लेषक चीजों को खोजने का एक बेवकूफ तरीका प्रतीत होता है, और पिछले अनुभव से, यह बहुत प्रासंगिक नहीं लगता है खोज परिणाम। क्या सीजेके विश्लेषक कुछ वजन या कुछ संशोधित करने के लिए विशेष रूप से करने के लिए मुझे कुछ करने की ज़रूरत है? धन्यवाद –

+0

मैंने कभी भी सीजेके विश्लेषक का उपयोग नहीं किया है, इसलिए यह नहीं कह सकता है। आप अधिक विशिष्ट सहायता के लिए लुसीन मेलिंग सूची (http://lucene.apache.org/java/docs/mailinglists.html#Java उपयोगकर्ता सूची) पर पूछने का प्रयास कर सकते हैं - ऐसे लोग हैं जो उस सूची में लुसीन के साथ बहुत अनुभवी हैं। – adrianbanks

संबंधित मुद्दे

 संबंधित मुद्दे