मैंने हाल ही में अपने django- संचालित साइट पर खोज क्षमताओं को जोड़ा है ताकि नियोक्ता कीवर्ड का उपयोग करके कर्मचारियों की खोज कर सकें। जब उपयोगकर्ता प्रारंभ में अपने रेज़्यूमे को अपलोड करता है, तो मैं इसे टेक्स्ट में बदलता हूं, स्टॉप शब्दों से छुटकारा पाता हूं, और फिर उस उपयोगकर्ता के लिए टेक्स्टफ़िल्ल्ड में टेक्स्ट जोड़ता हूं। मैंने जोओश खोज इंजन के साथ Django-Haystack का उपयोग किया।Django Haystack substring search
तीन बातें
1) एक तरफ जो मैं शायद का उपयोग नहीं करेंगे अतिरिक्त सुविधाओं से, वहाँ Solr या Xapian का उपयोग करने जा करने के लिए कोई ठोस लाभ है?
2) पाठ में फिर से शुरू करने में, मैं अनिवार्य रूप से पीडीएफ को इंडेक्स करता हूं। मैं Xapian और Solr समर्थन दोनों को जानता हूं। पीडीएफ इंडेक्सिंग, हालांकि, इसके दिखने से हेस्टैक नहीं करता है। इस बारे में कोई सुझाव कैसे है? या मुझे इसे स्वयं अनुक्रमणित करना चाहिए? यदि हां, तो क्या मुझे केवल कीवर्ड की टेक्स्ट फ़ाइल प्रदान करने से अधिक कुछ करना चाहिए?
3) कीवर्ड केवल तभी परिणाम देता है जब कीवर्ड स्वयं ठीक से मेल खाता हो। यदि किसी उपयोगकर्ता के पास उनके कीवर्ड के रूप में 'गणित' है, और मैं 'गणित' खोजता हूं, तो मैं उस उपयोगकर्ता को दिखाना चाहता हूं। मैं निश्चित रूप से यह नहीं बता सका कि Xapian या Solr इसका समर्थन करता है या नहीं। विचार?
किसी भी सुझाव के लिए धन्यवाद। मैं समय के लिए खुद को खोदने जा रहा हूं।
क्या आपने अपने प्रश्न के उत्तर का जवाब दिया था? क्या आप कृपया हमारे साथ साझा करना चाहते हैं – Armance