मेरे पास लगभग 700 जीबी की एक सोलर/ल्यूसीन इंडेक्स फ़ाइल है। जिन दस्तावेजों को मुझे इंडेक्स करने की आवश्यकता है उन्हें रीयल-टाइम में पढ़ा जा रहा है, हर 30 मिनट में लगभग 1000 दस्तावेज़ सबमिट किए जाते हैं और उन्हें अनुक्रमित करने की आवश्यकता होती है। मेरे परिदृश्य में प्रत्येक 30 मिनट में एक स्क्रिप्ट चलायी जाती है जो दस्तावेजों को अनुक्रमित करता है जो अभी तक अनुक्रमित नहीं हैं, क्योंकि यह एक आवश्यकता है कि नए दस्तावेज़ जल्द से जल्द खोजे जा सकें, लेकिन यह प्रक्रिया खोज को धीमा कर देती है।सूचकांक वास्तविक समय रखने के लिए सबसे अच्छा तरीका है?
क्या यह सबसे अच्छा तरीका है कि मैं नवीनतम दस्तावेज़ों को अनुक्रमित कर सकता हूं या कोई अन्य बेहतर तरीका है!
अपडेट: सोलर में अब (पास) वास्तविक समय की खोज क्षमताएं हैं। अधिक जानकारी के लिए – mt3
@ mt3 लिंक? – Simon
@Simon देरी से जवाब के लिए खेद है। यह सोलर/लुसेन शाखा के ट्रंक में है। http://wiki.apache.org/solr/NearRealtimeSearch – mt3