अनुक्रमण करते समय, लुसेन टेक्स्ट को परमाणु इकाइयों (टोकन) में विभाजित करता है। इस चरण के दौरान कई चीजें हो सकती हैं (उदा। कम करने, रोकने, रोकने के लिए, आदि)। अंतिम परिणाम एक शब्द है।
फिर, जब आप पूछते हैं, ल्यूसीन क्वेरी में बिल्कुल वही एल्गोरिदम लागू करता है ताकि यह शब्द को टर्म के साथ मिल सके।
प्रश्न: TermQuery
क्यों विश्लेषक की आवश्यकता नहीं है?
ए: QueryParser
ऑब्जेक्ट पार्स क्वेरी स्ट्रिंग और TermQuery
उत्पन्न करता है (अन्य प्रकार के प्रश्न भी उत्पन्न कर सकता है, उदाहरण के लिए PhraseQuery
)। TermQuery
में पहले से ही उसी आकार में वे शब्द हैं जो वे इंडेक्स में हैं। यदि आप (प्रोग्रामर के रूप में) पूरी तरह से सुनिश्चित हैं कि आप क्या कर रहे हैं, तो आप TermQuery
स्वयं बना सकते हैं - लेकिन ऐसा लगता है कि आप क्वेरी पार्सिंग के सटीक अनुक्रम को जानते हैं और आप जानते हैं कि इंडेक्स में शब्द कैसा दिखते हैं।
प्रश्न: BooleanQuery
क्यों विश्लेषक की आवश्यकता नहीं है?
ए: BooleanQuery
ऑपरेटरों का उपयोग करके अन्य प्रश्नों में शामिल हो जाता है (AND/OR/MUST/SHOULD, आदि)। यह किसी अन्य प्रश्न के बिना वास्तव में उपयोगी नहीं है।
यह बहुत सरलीकृत उत्तर है। मैं अत्यधिक Introduction to Information Retrieval पुस्तक पढ़ने की सलाह देता हूं; इसमें सिद्धांत शामिल है जिस पर ल्यूसीन (और अन्य समान ढांचे) लिखा गया है। यह पुस्तक मुफ्त में ऑनलाइन उपलब्ध है।
धन्यवाद लेकिन यह समझाता नहीं है कि विश्लेषक को निर्दिष्ट क्यों करना आवश्यक है जब पूछताछ करने के लिए स्ट्रिंग को पार्स करना और पूछताछ के दौरान हमेशा नहीं। – haim770
मेरा जवाब संपादित करें, मुझे बताएं कि क्या यह पर्याप्त स्पष्ट नहीं है या कुछ भी याद करता है। – mindas