जब मैं मानक विश्लेषक का उपयोग करके अपने ल्यूसीन इंडेक्स को खोजने के लिए Luke का उपयोग करता हूं, तो मैं फ़ील्ड देख सकता हूं जिसमें मैं खोज कर रहा हूं, जिसमें MY_VALUE फ़ॉर्म के मान शामिल हैं। जब मैं फ़ील्ड की खोज करता हूं: "MY_VALUE" हालांकि, क्वेरी को फ़ील्ड के रूप में पार्स किया गया है: "मेरा मान"लुसेन खोज और अंडरस्कोर
क्या अंडरस्कोर (_) वर्ण से बचने का कोई आसान तरीका है ताकि वह इसकी खोज कर सके?
संपादित करें:
4/1/2010 11:08 AM PST
मुझे लगता है कि Lucene 2.9.1 के लिए tokenizer में एक बग है और यह शायद वहाँ से पहले किया गया था। ल्यूक को लोड और "BB_HHH_FFFF5_SSSS", जब वहाँ एक संख्या है, तो निम्न टोकन लौटा दिया जाता है के लिए खोज करने की कोशिश:
"bb hhh_ffff5_ssss"
कुछ परीक्षण के बाद, मैं पाया है कि इस वजह से है रेखावृत्त। अगर मैं इनपुट
"BB_HHH_FFFF_SSSS", मैं
"bb hhh ffff ssss"
इस बिंदु पर, मैं एक tokenizer बग की ओर झुकाव रहा हूँ जब तक संख्या की उपस्थिति इस राशि माना जाता है व्यवहार लेकिन मैं देखने में असफल क्यों।
किसी को भी इस बात की पुष्टि कर सकते हैं?
नहीं, मैं इंडेक्सर जिसके कारण यह अजीब है के रूप में मानक विश्लेषक का उपयोग किया था। – Matt
यदि आप मानक विश्लेषक का उपयोग करके अनुक्रमित करते हैं तो आपके सूचकांक में "मेरा" और "मान" दो अलग टोकन के रूप में होगा। "मेरा मूल्य" (उद्धरण समेत) के लिए खोज करने का प्रयास करें और आपको परिणाम मिल सकते हैं। – Thomas
मैं दोबारा जांच करूँगा कि आप किस विश्लेषक के लिए अनुक्रमण कर रहे हैं। यदि आपने अनुक्रमण के लिए मानक विश्लेषक का उपयोग किया है, तो MY_VALUE को एक शब्द के रूप में असंभव करना है, क्योंकि मानक विश्लेषक हमेशा अंडरस्कोर पर विभाजित होता है। – bajafresh4life