2010-03-26 11 views
8

जब मैं मानक विश्लेषक का उपयोग करके अपने ल्यूसीन इंडेक्स को खोजने के लिए Luke का उपयोग करता हूं, तो मैं फ़ील्ड देख सकता हूं जिसमें मैं खोज कर रहा हूं, जिसमें MY_VALUE फ़ॉर्म के मान शामिल हैं। जब मैं फ़ील्ड की खोज करता हूं: "MY_VALUE" हालांकि, क्वेरी को फ़ील्ड के रूप में पार्स किया गया है: "मेरा मान"लुसेन खोज और अंडरस्कोर

क्या अंडरस्कोर (_) वर्ण से बचने का कोई आसान तरीका है ताकि वह इसकी खोज कर सके?

संपादित करें:

4/1/2010 11:08 AM PST

मुझे लगता है कि Lucene 2.9.1 के लिए tokenizer में एक बग है और यह शायद वहाँ से पहले किया गया था। ल्यूक को लोड और "BB_HHH_FFFF5_SSSS", जब वहाँ एक संख्या है, तो निम्न टोकन लौटा दिया जाता है के लिए खोज करने की कोशिश:

"bb hhh_ffff5_ssss"

कुछ परीक्षण के बाद, मैं पाया है कि इस वजह से है रेखावृत्त। अगर मैं इनपुट

"BB_HHH_FFFF_SSSS", मैं

"bb hhh ffff ssss"

इस बिंदु पर, मैं एक tokenizer बग की ओर झुकाव रहा हूँ जब तक संख्या की उपस्थिति इस राशि माना जाता है व्यवहार लेकिन मैं देखने में असफल क्यों।

किसी को भी इस बात की पुष्टि कर सकते हैं?

उत्तर

1

ऐसा लगता है कि आपने उस क्षेत्र को इंडेक्स करने के लिए मानक विश्लेषक का उपयोग नहीं किया है। ल्यूक में आपको MY_VALUE सही तरीके से मिलान करने के लिए उस क्षेत्र को अनुक्रमणित करने के लिए उपयोग किए गए विश्लेषक का चयन करना होगा।

संयोग से, आप कीवर्ड एनालिज़र का उपयोग कर MY_VALUE से मिलान करने में सक्षम हो सकते हैं।

+0

नहीं, मैं इंडेक्सर जिसके कारण यह अजीब है के रूप में मानक विश्लेषक का उपयोग किया था। – Matt

+3

यदि आप मानक विश्लेषक का उपयोग करके अनुक्रमित करते हैं तो आपके सूचकांक में "मेरा" और "मान" दो अलग टोकन के रूप में होगा। "मेरा मूल्य" (उद्धरण समेत) के लिए खोज करने का प्रयास करें और आपको परिणाम मिल सकते हैं। – Thomas

+0

मैं दोबारा जांच करूँगा कि आप किस विश्लेषक के लिए अनुक्रमण कर रहे हैं। यदि आपने अनुक्रमण के लिए मानक विश्लेषक का उपयोग किया है, तो MY_VALUE को एक शब्द के रूप में असंभव करना है, क्योंकि मानक विश्लेषक हमेशा अंडरस्कोर पर विभाजित होता है। – bajafresh4life

1

मुझे नहीं लगता कि आप इस उपयोग के मामले के लिए मानक विश्लेषक का उपयोग करने में सक्षम होंगे।

आंकना मैं क्या सोचता अपनी आवश्यकताओं के हैं, कीवर्ड विश्लेषक कम प्रयास (पूरे क्षेत्र में एक भी शब्द हो जाता है) के लिए ठीक काम करना चाहिए।

मुझे लगता है कि ल्यूक के साथ मैदान को देखते समय कुछ भ्रम उत्पन्न होता है। संग्रहीत मूल्य नहीं प्रश्नों द्वारा उपयोग किया जाता है, आपको क्या चाहिए शर्तें हैं। मुझे संदेह है कि जब आप अपने क्षेत्र के लिए संग्रहीत शर्तों को देखते हैं, तो वे "मेरा" और "मूल्य" होंगे।

आशा इस मदद करता है,

संबंधित मुद्दे