मैं कई दस्तावेजों के शीर्षकों को रोकने के लिए एक स्नोबॉल विश्लेषक का उपयोग कर रहा हूं। सब कुछ अच्छी तरह से काम करता है, लेकिन उनके कुछ quirks हैं।वाइल्डकार्ड और स्टेमिंग के संयोजन का उपयोग
उदाहरण:
"valv", "वाल्व", या "वाल्व" की खोज रिटर्न परिणामों के एक ही नंबर। यह समझ में आता है क्योंकि स्नोबॉल विश्लेषक सबकुछ नीचे "वाल्व" को कम कर देता है।
मैं वाइल्डकार्ड का उपयोग करते समय समस्याओं में भाग लेता हूं। "वाल्व *" या "वाल्व *" की खोज किसी भी परिणाम को वापस नहीं करती है। अपेक्षित के रूप में "वाल्व *" काम करता है।
मुझे समझ में आता है कि यह क्यों हो रहा है, लेकिन मुझे नहीं पता कि इसे कैसे ठीक किया जाए।
मैंने एक विश्लेषक लिखने के बारे में सोचा जो स्टेमड और गैर-स्टेमड टोकन स्टोर करता है। मूल रूप से दो विश्लेषकों को लागू करना और दो टोकन धाराओं को जोड़ना। लेकिन मुझे यकीन नहीं है कि यह एक व्यावहारिक समाधान है।
मैंने एनालिजिंगवर्कर पार्सर का उपयोग करने के बारे में भी सोचा, लेकिन मुझे नहीं पता कि इसे मल्टीफ़ील्ड क्वेरी पर कैसे लागू किया जाए। इसके अलावा, "वाल्व *" की खोज करते समय एनालिजिंगक्वायर पार्सर का उपयोग "वाल्व" के लिए परिणाम लौटाएगा और यह अपेक्षित व्यवहार नहीं है।
क्या वाइल्डकार्ड और स्टेमिंग एल्गोरिदम दोनों का उपयोग करने का "पसंदीदा" तरीका है?
+1, यह करने का यह सबसे स्वाभाविक तरीका है। –