लुसेन खोज और अंडरस्कोर

जब मैं मानक विश्लेषक का उपयोग करके अपने ल्यूसीन इंडेक्स को खोजने के लिए Luke का उपयोग करता हूं, तो मैं फ़ील्ड देख सकता हूं जिसमें मैं खोज कर रहा हूं, जिसमें MY_VALUE फ़ॉर्म के मान शामिल हैं। जब मैं फ़ील्ड की खोज करता हूं: "MY_VALUE" हालांकि, क्वेरी को फ़ील्ड के रूप में पार्स किया गया है: "मेरा मान"लुसेन खोज और अंडरस्कोर

क्या अंडरस्कोर (_) वर्ण से बचने का कोई आसान तरीका है ताकि वह इसकी खोज कर सके?

संपादित करें:

4/1/2010 11:08 AM PST

मुझे लगता है कि Lucene 2.9.1 के लिए tokenizer में एक बग है और यह शायद वहाँ से पहले किया गया था। ल्यूक को लोड और "BB_HHH_FFFF5_SSSS", जब वहाँ एक संख्या है, तो निम्न टोकन लौटा दिया जाता है के लिए खोज करने की कोशिश:

"bb hhh_ffff5_ssss"

कुछ परीक्षण के बाद, मैं पाया है कि इस वजह से है रेखावृत्त। अगर मैं इनपुट

"BB_HHH_FFFF_SSSS", मैं

"bb hhh ffff ssss"

इस बिंदु पर, मैं एक tokenizer बग की ओर झुकाव रहा हूँ जब तक संख्या की उपस्थिति इस राशि माना जाता है व्यवहार लेकिन मैं देखने में असफल क्यों।

किसी को भी इस बात की पुष्टि कर सकते हैं?

स्रोत

2010-03-26 Matt

ऐसा लगता है कि आपने उस क्षेत्र को इंडेक्स करने के लिए मानक विश्लेषक का उपयोग नहीं किया है। ल्यूक में आपको MY_VALUE सही तरीके से मिलान करने के लिए उस क्षेत्र को अनुक्रमणित करने के लिए उपयोग किए गए विश्लेषक का चयन करना होगा।

संयोग से, आप कीवर्ड एनालिज़र का उपयोग कर MY_VALUE से मिलान करने में सक्षम हो सकते हैं।

स्रोत

2010-03-26 19:12:47 bajafresh4life

नहीं, मैं इंडेक्सर जिसके कारण यह अजीब है के रूप में मानक विश्लेषक का उपयोग किया था। – Matt

यदि आप मानक विश्लेषक का उपयोग करके अनुक्रमित करते हैं तो आपके सूचकांक में "मेरा" और "मान" दो अलग टोकन के रूप में होगा। "मेरा मूल्य" (उद्धरण समेत) के लिए खोज करने का प्रयास करें और आपको परिणाम मिल सकते हैं। – Thomas

मैं दोबारा जांच करूँगा कि आप किस विश्लेषक के लिए अनुक्रमण कर रहे हैं। यदि आपने अनुक्रमण के लिए मानक विश्लेषक का उपयोग किया है, तो MY_VALUE को एक शब्द के रूप में असंभव करना है, क्योंकि मानक विश्लेषक हमेशा अंडरस्कोर पर विभाजित होता है। – bajafresh4life

मुझे नहीं लगता कि आप इस उपयोग के मामले के लिए मानक विश्लेषक का उपयोग करने में सक्षम होंगे।

आंकना मैं क्या सोचता अपनी आवश्यकताओं के हैं, कीवर्ड विश्लेषक कम प्रयास (पूरे क्षेत्र में एक भी शब्द हो जाता है) के लिए ठीक काम करना चाहिए।

मुझे लगता है कि ल्यूक के साथ मैदान को देखते समय कुछ भ्रम उत्पन्न होता है। संग्रहीत मूल्य नहीं प्रश्नों द्वारा उपयोग किया जाता है, आपको क्या चाहिए शर्तें हैं। मुझे संदेह है कि जब आप अपने क्षेत्र के लिए संग्रहीत शर्तों को देखते हैं, तो वे "मेरा" और "मूल्य" होंगे।

आशा इस मदद करता है,

स्रोत

2010-03-31 01:18:06

लुसेन खोज और अंडरस्कोर

उत्तर

संबंधित मुद्दे