2010-08-08 18 views
7

मैंने हाल ही में अपने django- संचालित साइट पर खोज क्षमताओं को जोड़ा है ताकि नियोक्ता कीवर्ड का उपयोग करके कर्मचारियों की खोज कर सकें। जब उपयोगकर्ता प्रारंभ में अपने रेज़्यूमे को अपलोड करता है, तो मैं इसे टेक्स्ट में बदलता हूं, स्टॉप शब्दों से छुटकारा पाता हूं, और फिर उस उपयोगकर्ता के लिए टेक्स्टफ़िल्ल्ड में टेक्स्ट जोड़ता हूं। मैंने जोओश खोज इंजन के साथ Django-Haystack का उपयोग किया।Django Haystack substring search

तीन बातें

1) एक तरफ जो मैं शायद का उपयोग नहीं करेंगे अतिरिक्त सुविधाओं से, वहाँ Solr या Xapian का उपयोग करने जा करने के लिए कोई ठोस लाभ है?

2) पाठ में फिर से शुरू करने में, मैं अनिवार्य रूप से पीडीएफ को इंडेक्स करता हूं। मैं Xapian और Solr समर्थन दोनों को जानता हूं। पीडीएफ इंडेक्सिंग, हालांकि, इसके दिखने से हेस्टैक नहीं करता है। इस बारे में कोई सुझाव कैसे है? या मुझे इसे स्वयं अनुक्रमणित करना चाहिए? यदि हां, तो क्या मुझे केवल कीवर्ड की टेक्स्ट फ़ाइल प्रदान करने से अधिक कुछ करना चाहिए?

3) कीवर्ड केवल तभी परिणाम देता है जब कीवर्ड स्वयं ठीक से मेल खाता हो। यदि किसी उपयोगकर्ता के पास उनके कीवर्ड के रूप में 'गणित' है, और मैं 'गणित' खोजता हूं, तो मैं उस उपयोगकर्ता को दिखाना चाहता हूं। मैं निश्चित रूप से यह नहीं बता सका कि Xapian या Solr इसका समर्थन करता है या नहीं। विचार?

किसी भी सुझाव के लिए धन्यवाद। मैं समय के लिए खुद को खोदने जा रहा हूं।

+1

क्या आपने अपने प्रश्न के उत्तर का जवाब दिया था? क्या आप कृपया हमारे साथ साझा करना चाहते हैं – Armance

उत्तर

6

दुर्भाग्यवश मुझे आपके अन्य प्रश्नों के उत्तर देने के लिए पर्याप्त जानकारी नहीं है, हालांकि बिंदु 3 के लिए) हूश वास्तव में इसका समर्थन करता है।

आपको SearchQuerySet के स्वत: पूर्ण कार्य का उपयोग करना होगा।

यहाँ विस्तृत: अपने आप से मेल खाता है http://docs.haystacksearch.org/dev/autocomplete.html

मैं वर्तमान में आंशिक पर हूँश और मिलान का उपयोग कर रहा हूँ।

संबंधित मुद्दे