आपके प्रश्नों
1.) मैं 5 लाख दस्तावेज़ के बारे में दौर के साथ एक डेटाबेस का जवाब देने के लिए। MySQL Fulltextsearch को 2-3 मिनट की आवश्यकता है। सोलर/ल्यूसीन को 200-400 मिलीसेकंड के समान खोज दौर की आवश्यकता होती है।
2.) आपको जिस स्थान की आवश्यकता है वह आपके कॉन्फ़िगरेशन, कॉपीफील्ड की संख्या और यदि आप डेटा संग्रहीत करते हैं या यदि आप केवल डेटा को अनुक्रमणित करते हैं। मेरी कॉन्फ़िगरेशन में, पूर्ण डीबी अनुक्रमित है, लेकिन केवल मेटाडेटा sored है। इसलिए 30 जीबी डीबी को सोलर/ल्यूसीन के लिए 40 जीबी की जरूरत है। ध्यान रखें, अगर आप अपनी अनुक्रमणिका को अनुकूलित (पुनः) करना चाहते हैं, तो आपको इंडेक्स-साइज का अस्थायी 100% फिर से चाहिए।
3.) यदि आप MySQL पूर्ण टेक्स्ट-इंडेक्स से लुसेन/सोलर में माइग्रेट करते हैं, तो आप CPU पावर को सहेजते हैं। MySQL फुलटेक्स्ट का उपयोग करने से सोलर फुलटेक्स्ट खोज से अधिक CPU पावर की आवश्यकता होती है -> उत्तर को देखें 1.)
4.) दस्तावेजों की संख्या, दस्तावेज़ों का आकार और डिस्क-स्पीड पर निर्भर करता है। बेशक सीपीयू प्रदर्शन बहुत महत्वपूर्ण है। इंडेक्स-टाइम के दौरान एकाधिक सीपीयू पर एक अच्छा स्केलिंग नहीं है। 8 बड़े कोर 8 छोटे कोर से अधिक तेज़ हैं। मेरे पर्यावरण में 5 मिलियन डॉक्स (44 जीबी) इंडेक्सिंग को दोहरी कोर वीएम वेयर सर्वर पर 2-3 घंटे की जरूरत है।
5.) MySQL फुलटेक्स्ट-इंडेक्स से लुसेन/सोलर फुलटेक्स्टिन्डेक्स में माइग्रेट करना अब तक का सबसे अच्छा विचार था। ;-) लेकिन शायद आपको अपने आवेदन को फिर से डिजाइन करना होगा।
// संपादित सवाल का जवाब देने
यह अपने Solr विन्यास पर निर्भर करता है "Lucene सूचकांक कुछ सम्मिलित बयान के तुरंत बाद अपडेट कर दिया जाएगा", लेकिन यह संबंधित प्रोग्रामिंग नहीं संभव
स्रोत
2012-01-03 10:22:25
है। –
@ रोस्डी लेकिन मुझे लगता है कि, इस प्रश्न का आपके आवेदन –