2011-03-02 8 views
13

यह प्रश्न एक सोलर इंस्टॉलेशन में कम, पृथक पढ़ने के समय के बारे में this question का अनुवर्ती है।क्या सोलर में एक अच्छा ऑटोवर्मिंग क्वेरी बनाता है और वे कैसे काम करते हैं?

नए खोजकर्ताओं के लिए एक संभावित समस्या गायब/खराब स्वाभाविक प्रश्नों के रूप में पाया गया था।

अब मैं उलझन में हूं कि ऑटोवर्मिंग प्रश्नों को कितना अच्छा दिखना चाहिए "।

मैंने पढ़ा लेकिन इस पर कोई अच्छा दस्तावेज नहीं मिला।

क्या उन्हें इंडेक्स में बहुत से दस्तावेज़ों को मारा जाना चाहिए? या क्या उनके पास इंडेक्स में मौजूद सभी विशिष्ट क्षेत्रों में मिलान होना चाहिए?

केवल *:* सर्वश्रेष्ठ ऑटोवर्मिंग क्वेरी नहीं होगी या क्यों नहीं?

<lst><str name="q">george</str> <str name="start">0</str> <str name="rows">10</str></lst> 

क्यों:

<lst><str name="q">solr</str> <str name="start">0</str> <str name="rows">10</str></lst> 
<lst><str name="q">rocks</str> <str name="start">0</str> <str name="rows">10</str></lst> 

मैं उन्हें करने के लिए बदल:

उदाहरण Solr config उस में इन नमूना प्रश्नों है? चूंकि सूचकांक शीर्षक और अभिनेताओं के लिए फ़ील्ड के साथ फिल्म इकाइयां रखता है। वे सबसे अधिक खोजे गए हैं। और जॉर्ज शीर्षक और अभिनेताओं में दिखाई देता है।

मुझे वास्तव में पता नहीं है कि यह समझ में आता है या नहीं। तो मेरा सवाल है:

  • मेरी अनुक्रमणिका के लिए अच्छा स्वाभाविक प्रश्न क्या होगा और क्यों?
  • क्या एक अच्छा ऑटोवर्मिंग क्वेरी बनाता है?

यह सूचकांक से एक उदाहरण दस्तावेज़ है। सूचकांक 70,000 के बारे में दस्तावेज़ नहीं है और वे सभी इस (केवल पाठ्यक्रम के विभिन्न मूल्यों) की तरह लग रहे: उदाहरण दस्तावेज़:

<doc> 
    <arr name="actor"><str>Tommy Lee Jones</str><str>Will Smith</str><str>Rip Torn</str> 
    <str>Lara Flynn Boyle</str><str>Johnny Knoxville</str><str>Rosario Dawson</str><str>Tony Shalhoub</str> 
    <str>Patrick Warburton</str><str>Jack Kehler</str><str>David Cross</str><str>Colombe Jacobsen-Derstine</str> 
    <str>Peter Spellos</str><str>Michael Rivkin</str><str>Michael Bailey Smith</str><str>Lenny Venito</str> 
    <str>Howard Spiegel</str><str>Alpheus Merchant</str><str>Jay Johnston</str><str>Joel McKinnon Miller</str> 
    <str>Derek Cecil</str></arr> 
    <arr name="affiliate"><str>amazon</str></arr> 
    <arr name="aka_title"><str>Men in Black II</str><str>MIB 2</str><str>MIIB</str> 
    <str>Men in Black 2</str><str>Men in black II (Hombres de negro II)</str><str>Hombres de negro II</str><str>Hommes en noir II</str></arr> 
    <bool name="blockbuster">false</bool> 
    <arr name="country"><str>US</str></arr> 
    <str name="description">Agent J (Will Smith) muss die Erde wieder vor einigem Abschaum bewahren, denn in Gestalt des verführerischen Dessous-Models Serleena (Lara Flynn Boyle) will ein Alien den Planeten unterjochen. Dabei benötigt J die Hilfe seines alten Partners Agent K (Tommy Lee Jones). Der wurde aber bei seiner "Entlassung" geblitzdingst, und so muß J seine Erinnerung erst mal etwas auffrischen bevor es auf die Jagd gehen kann.</str> 
    <arr name="director"><str>Barry Sonnenfeld</str></arr> 
    <int name="film_id">120912</int> 
    <arr name="genre"><str>Action</str><str>Komödie</str><str>Science Fiction</str></arr> 
    <str name="id">120912</str> 
    <str name="image_url">/media/search/filmcovers/105x/kf/false/F6Q1XW.jpg</str> 
    <int name="imdb_id">120912</int> 
    <date name="last_modified">2011-03-01T18:51:35.903Z</date> 
    <str name="locale_title">Men in Black II</str> 
    <int name="malus">3238</int> 
    <int name="parent_id">0</int> 
    <arr name="product_dvd"><str>amazon</str></arr> 
    <arr name="product_type"><str>dvd</str></arr> 
    <int name="rating">49</int> 
    <str name="sort_title">meninblack</str> 
    <int name="type">1</int> 
    <str name="url">/film/Men-in-Black-II-Barry-Sonnenfeld-Tommy-Lee-Jones-F6Q1XW/</str> 
    <int name="year">2002</int> 
</doc> 

अधिकांश प्रश्नों जगह में कुछ फिल्टर के साथ अभिनेता खेतों पर सटीक मिलान क्वेरी दी गई हैं।

उदाहरण:

जानकारी: [] webapp =/Solr पथ =/चयन/ पैरामीटर = {पहलू = सच & प्रकार = स्कोर + एएससी, + मैलस + एएससी, + साल + desc & hl .simple.pre = starthl & hl = सच & संस्करण = 2.2 & fl = *, स्कोर & facet.query = साल [1900 + के लिए + 1950] & facet.query = साल [1951 + के लिए + 1980] & facet.query = year: [1 9 81 + TO + 1990] & facet.query = year: [1 991 + TO + 2000],210 facet.query = साल: [2001 + के लिए + 2011] & BF के = div (उप (10000, मैलस), 100)^10 & hl.simple.post = endhl & facet.field = शैली & facet.field = देश & facet.field = blockbuster & facet.field = affiliate & facet.field = product_type & qs = 5 & qt = dismax & hl।fragsize = 200 & मिमी = 2 & facet.mincount = 1 & QF = अभिनेता^0.1 & f.blockbuster.facet.mincount = 0 & f.genre.facet.limit = 20 & hl.fl = अभिनेता & wt = json & f.affiliate.facet.mincount = 1 & f.country.facet.limit = 20 & पंक्तियों = 10 & पीएफ = अभिनेता^5 & शुरू = 0 & q = "Josi + Kleinpeter" & ps = 3} हिट = 1 स्थिति = 0 क्यूटीम = 4

उत्तर

15

2 प्रकार के वार्मिंग हैं। क्वेरी कैश वार्मिंग और दस्तावेज़ कैश वार्मिंग (फ़िल्टर भी हैं, लेकिन वे प्रश्नों के समान हैं)। क्वेरी कैश वार्मिंग एक सेटिंग के माध्यम से की जा सकती है जो इंडेक्स को पुनः लोड करने से पहले हाल के प्रश्नों की एक्स संख्या को फिर से चलाएगी। दस्तावेज़ कैश वार्मिंग अलग है।

दस्तावेज़ कैश वार्मिंग का लक्ष्य दस्तावेज़ कैश में आपके सबसे अधिक उपयोग किए जाने वाले दस्तावेज़ों की बड़ी मात्रा प्राप्त करना है ताकि उन्हें डिस्क से पढ़ना न पड़े। तो, आपके प्रश्नों पर इस पर ध्यान देना चाहिए। आपको यह जानने की कोशिश करनी चाहिए कि आपके सबसे अधिक बार खोजे गए दस्तावेज़ क्या हैं और उन्हें लोड करें। पसंदीदा रूप से कम से कम प्रश्नों के साथ। इसका क्षेत्र की वास्तविक सामग्री से कोई लेना देना नहीं है। संपादित करें: स्पष्टीकरण के लिए। जब दस्तावेज़ कैश को गर्म करते हैं तो आपकी प्राथमिक रुचि वह दस्तावेज है जो अक्सर खोज परिणामों में बदलती है, भले ही वे पूछे जाने वाले प्रश्नों के बावजूद। देश से

  • लोड हो रहा है, अगर अपनी खोजों के सबसे अमेरिका फिल्मों के लिए कर रहे हैं:

    व्यक्तिगत रूप से, मैं जैसी चीजों के लिए खोजों को चला था।

  • साल के आधार पर लोड हो रहा है, यदि आपकी अधिकांश खोज हाल ही की फिल्मों के लिए हैं।
  • शैली द्वारा लोड हो रहा है, यदि आपके पास भारी खोजी गई शैलियों की एक छोटी सूची है।

आखिरी संभावना उन सभी को लोड करना है। आपके दस्तावेज़ छोटे दिखते हैं। उनमें से 70,000 आजकल सर्वर मेमोरी के मामले में कुछ भी नहीं है। यदि आपका दस्तावेज़ कैश काफी बड़ा है, और आपके पास पर्याप्त मेमोरी उपलब्ध है, तो इसके लिए जाएं। एक साइड नोट के रूप में, आपका कुछ सबसे बड़ा लाभ आपके दस्तावेज़ कैश से होगा। एक क्वेरी कैश बार-बार पूछताछ के लिए फायदेमंद है, जो निराशाजनक रूप से कम हो सकता है। आप लगभग हमेशा एक बड़े दस्तावेज़ कैश से लाभान्वित होते हैं।

+0

ओपी एक फ़ील्ड और/या फ़िल्टर कैश का भी उपयोग कर रहा है, जो गर्म होने के लिए भी अच्छा होगा। यदि आपके पास enum facet है, उदाहरण के लिए, यह उस फ़िल्टर से मेल खाने वाले दस्तावेज़ों का बिटमैप कैश करेगा, इसलिए आप उन सभी को गर्म करना चाहते हैं। इस मामले में, आप केवल प्रश्न न केवल प्रश्न पूछना महत्वपूर्ण है। – Xodarap

+0

@Xodarap - मुझे विश्वास है कि फ़िल्टर कैश को पूरी तरह से गर्म किया जा सकता है। इंडेक्स को फिर से लोड करने से पहले वे हाल ही में चलने वाले प्रश्नों के सबसेट के रूप में दौड़ते हैं। हालांकि यह एक गर्म स्वैप पर है। एक ठंडी शुरुआत पर, हाँ सवाल मायने रखता है। – rfeak

संबंधित मुद्दे