2010-03-11 17 views
13

पर फ़ील्ड के आधार पर बूस्टर सोलर परिणाम जो मैं वेब पर एक अनुक्रमण और खोज ढांचे की तलाश कर रहा था और सोलर पर ठोकर खा रहा था। एक ऐसी कार्यक्षमता जिसे हम पूरी तरह से जरूरी रखते हैं, उस हिट के आधार पर परिणामों को बढ़ावा देना है।हिट

एक छोटा सा उदाहरण:

<movie> 
    <title>The Dark Knight</title> 
    <alternative_title>Batman Begins 2</alternative_title> 
    <year>2008</year> 
    <director>Christopher Nolan</director> 
    <plot>Batman, Gordon and Harvey Dent are forced to deal with the chaos unleashed by an anarchist mastermind known only as the Joker, as it drives each of them to their limits.</plot> 
</movie> 

मैं उदाहरण के लिए संयोजित करना चाहते हैं शीर्षक, alternative_title और साजिश एक खोज क्षेत्र है, जो भी मुश्किल नहीं है के बाद में फ़ील्ड:

इस तरह एक रिकॉर्ड पर विचार करें सोलर/लुसीन दस्तावेज और ट्यूटोरियल देख रहे हैं। हालांकि मैं यह भी चाहता हूं कि जिन फिल्मों में शीर्षक में हिट है, उनके पास वैकल्पिक_शीर्षक पर हिट की तुलना में उच्च स्कोर है और उनकी बारी में उन लोगों को साजिश क्षेत्र में हिट से अधिक स्कोर करना चाहिए। क्या एक्सएमएल में इस तरह के स्कोरिंग को इंगित करने का कोई तरीका है या क्या हमें कुछ कस्टम स्कोरिंग एल्गोरिदम विकसित करने की आवश्यकता है?

कृपया यह भी ध्यान दें कि मैंने जो उदाहरण दिया है वह काल्पनिक है और असली डेटा में शायद 100+ फ़ील्ड होंगे।

अग्रिम धन्यवाद,

टॉम

उत्तर

1

यदि यह है कि एक खोज लेकिन पूरी साइट के लिए विशिष्ट नहीं है कार्यक्षमता है। आप इंडेक्सिंग समय पर शीर्षक को बढ़ा सकते हैं। बूस्टिंग क्षेत्र को एक उच्च प्रासंगिकता स्कोर प्रदान करता है, जो आपको वही लगता है जो आप चाहते हैं।

इस लिंक चेक आउट:

http://wiki.apache.org/solr/UpdateXmlMessages#Optional_attributes_for_.22field.22

6

मैं Solr उपयोग नहीं किया है, लेकिन मैं Lucene का उपयोग किया है। को देख में:

http://wiki.apache.org/solr/SolrQuerySyntax

यह कहा गया है कि Solr के क्वेरी सिंटैक्स Lucene का का सुपरसेट है। और Lucene में, जिस तरह से आप प्रति फ़ील्ड को बूस्ट प्रदर्शन कर सकते हैं, गाजर ऑपरेटर कुछ मनमाना मूल्य के बाद उपयोग करने के लिए है अर्थात्

title:batman^10 alternative_title:batman

क्वेरी-समय में ऐसा करने का लाभ यह है कि आप ठीक कर सकते हैं आपके पास प्रासंगिकता के मानक के मिलान के लिए फ्लाई पर बढ़ावा मूल्य। तो यदि 10 का बूस्ट वैल्यू बहुत अधिक है, तो आप तदनुसार इसे ट्वीक कर सकते हैं।

11

यही वह है जो सोलर डिसमैक्सक्वायरपार्सर के लिए डिज़ाइन किया गया था। देखें http://wiki.apache.org/solr/DisMaxRequestHandler

बहुत सारे पैरामीटर हैं, लेकिन मुख्य रूप से आपको अनुकूलित करने की आवश्यकता है "qf", यह है कि आप कैसे निर्दिष्ट करते हैं कि प्रत्येक फ़ील्ड को किस प्रकार खोजा जाना चाहिए और प्रत्येक के लिए बढ़ावा देना चाहिए।

शीर्षक^10 alternative_title^2 निदेशक^1 भूखंड^1

QF पैरामीटर का मान के रूप में

: तो अगर आप शीर्षक पर हावी करना चाहते हैं, आप की तरह कुछ निर्दिष्ट कर सकता है। आप वहां से उदाहरण कॉन्फ़िगरेशन और प्रयोग को अनुकूलित करके इसे सेट अप कर सकते हैं।

संबंधित मुद्दे