का उपयोग कर के आँकड़े मैं Lucene का उपयोग कर एक वेब अनुप्रयोग के एक खोज घटक के विकास कर रहा हूँ। मैं उपयोगकर्ता क्वेरी को एक इंडेक्स में सहेजना चाहता हूं और उपयोगकर्ताओं को वैकल्पिक प्रश्नों का सुझाव देने के लिए और क्वेरी आंकड़े रखने के लिए उनका उपयोग करना चाहता हूं (अक्सर उपयोग किए जाने वाले प्रश्न, शीर्ष स्कोरिंग प्रश्न, ...)।रखते हुए क्वेरी Lucene
वैकल्पिक प्रश्न सुझाव के लिए इस डेटा का उपयोग करने के लिए, मैं देखना चाहता है जो मामले को सबसे अधिक बार एक दूसरे के साथ इस्तेमाल किया है और का उपयोग करें कि उपयोगकर्ता के लिए एक सुझाव बनाने के लिए कर रहे हैं क्वेरी का विश्लेषण करेंगे।
लेकिन मैं समझ नहीं है, जिसमें डेटा सूचकांक के रूप में। मैं इंडेक्स में केवल प्रश्नों को जोड़ने की सोच रहा था, लेकिन इस तरह से बहुत सारे अनावश्यक डेटा हो सकते हैं क्योंकि इंडेक्स में कई दस्तावेजों में एक ही सामग्री होगी। क्या किसी के पास इस तरीके के बारे में कोई विचार है?
सहायता के लिए धन्यवाद।
मैंने ऐसा करने के बारे में सोचा, लेकिन मुझे प्रश्नों (कुछ बार इस्तेमाल किए जाने वाले समय, हिट की संख्या) पर कुछ आंकड़े रखने की आवश्यकता है और इसे प्राप्त करने के बारे में सोचने का एकमात्र तरीका यह है कि कई बार सूचकांक में उपयोग किया जाता है और दस्तावेज़ को अपडेट करने से पहले इसे बढ़ाता है, लेकिन यह एक महंगी ऑपरेशन की तरह लगता है। – jbradaric
क्या आप इसे करने के लिए ल्यूसीन से टर्म फ्रीक्वेंसी का उपयोग कर सकते हैं? http://stackoverflow.com/questions/667389/get-term-frequencies-in-lucene। यदि आप रीयल-टाइम में क्वेरी अनुशंसाएं करना चाहते हैं तो आप फ्रीक के समय को पहले से गणना करना और उन्हें स्टोर करना चाहते हैं। – Joel
यदि मैं प्रश्नों को एक अद्वितीय क्षेत्र के रूप में संग्रहीत नहीं करता हूं, तो मैं टर्मफ्रीक्वेंसी का उपयोग कर सकता हूं, लेकिन मैं इससे बचने की उम्मीद कर रहा था। लेकिन ऐसा लगता है कि जब तक समाधान भी मौजूद नहीं होता है, तब तक मुझे प्रश्नों को गैर-अद्वितीय के रूप में स्टोर करना होगा जब तक कि मैं एक बेहतर समाधान नहीं समझता। – jbradaric