2010-09-27 11 views
15

क्या Lucene का उपयोग पूर्ण रूप से डेटा स्टोर (जैसे अन्य (मोंगो, सोफे) nosql रूपों के रूप में करना संभव है)।डेटा स्टोर के रूप में ल्यूसीन

मुझे पता है कि एक इंडेक्सर द्वारा नए अपडेट किए गए दस्तावेज़ों जैसी कुछ सीमाएं अन्य इंडेक्सर में दिखाई नहीं दी जाएंगी। इसलिए हमें अपडेट प्राप्त करने के लिए इंडेक्सर को पुनरारंभ करना होगा।

लेकिन मैं हाल ही में solr पर ठोकर खा रहा हूं, ऐसा लगता है कि इन समस्याओं को किसी प्रकार की स्नैपशॉट प्रतिकृति से बचाया जाता है।

इसलिए मैंने सोचा कि मैं डेटा स्टोर के रूप में ल्यूसीन का उपयोग कर सकता हूं क्योंकि यह दस्तावेजों को प्रबंधित करने के लिए आंतरिक रूप से मोंगो और सोफे द्वारा उपयोग किए जाने वाले एक ही प्रकार के दस्तावेज़ (जेएसओएन आधारित) का उपयोग करता है, और इसके सिद्ध इंडेक्सिंग एल्गोरिदम रिकॉर्ड को तेज़ी से प्राप्त करते हैं।

लेकिन मुझे उत्सुकता है कि किसी ने पहले कोशिश की है ..? यदि नहीं, तो इस दृष्टिकोण को चुनने के कारण क्या हैं।

+1

मुझे लुसीन के बारे में बहुत कुछ पता नहीं है, लेकिन मैंने सोचा कि यह ज्यादातर सूचकांक था; कि यह दस्तावेज़ को संग्रहीत नहीं करता है, यह सिर्फ उन्हें अनुक्रमित करता है। तो आपको ल्यूसीन के बाहर किसी भी डेटा स्टोर की ज़रूरत है ... क्या मैं कोई समझ रहा हूं? – pascal

+1

@ पास्कल, इसका गलत .. ल्यूसीन दस्तावेजों को भी स्टोर कर सकता है। जब हम फ़ील्ड को परिभाषित करते हैं तो हम निर्दिष्ट कर सकते हैं कि हमें आइटम को स्टोर करने की आवश्यकता है या सिर्फ इंडेक्स ... – RameshVel

+2

देखें http://stackoverflow.com/questions/3215029/nosql-mongodb-vs-lucene-or-solr-as-your -डेटाबेस/3216550 # 3216550 – Mikos

उत्तर

4

मैंने केवल सोलर, ल्यूसीन व्युत्पन्न (और मैं किसी के बारे में सोलर का उपयोग करने की सलाह दूंगा) के साथ काम किया है, इसलिए मेरी राय थोड़ा पक्षपातपूर्ण हो सकती है लेकिन यह एक डेटास्टोर हां के रूप में सोलर का उपयोग करना संभव होना चाहिए, हालांकि यह पृष्ठभूमि में कुछ और स्थायी के बिना बहुत उपयोगी नहीं होगा।

आपको जिस समस्या का सामना करना पड़ सकता है वह यह है कि सोलर में डेटा दर्ज करने से आप गारंटी नहीं देते हैं कि आप इसे वापस प्राप्त करेंगे। सुंदर सख्त पहलू के उपयोग को बाधित करने से आपको अपने डेटा को पुनः प्राप्त करने में समस्याएं आ सकती हैं क्योंकि इंडेक्सर ने आपके परिणामों को एक निश्चित तरीके से एकजुट करने का निर्णय लिया है।

मैंने इस दृष्टिकोण के साथ थोड़ा प्रयोग किया है, लेकिन मैंने देखा कि एकमात्र वास्तविक लाभ उन परिस्थितियों में था जहां आप क्लाइंट पक्ष पर खोज अनुक्रमणिका चाहते हैं ताकि वे आंतरिक रूप से आंतरिक रूप से खोज कर सकें और विस्तारित जानकारी के लिए डेटाबेस को क्वेरी कर सकें।

मेरा सुझाव खोज के लिए सोलर का उपयोग करना है और उसके बाद यह डेटा के एक छोटे से नमूना को वापस कर सकता है जिसे आप चाहते हैं साथ ही एक पारंपरिक डेटा स्टोर में आगे पूछताछ के लिए एक सूचकांक।

टीएल; डीआर: हाँ, लेकिन मैं इसकी अनुशंसा नहीं करता।

15

स्थायित्व की समस्या भी है। जबकि ल्यूसीन इंडेक्स कभी भी दूषित नहीं होना चाहिए, मैंने इसे देखा है। और लुसीन एक टूटी हुई इंडेक्स की मरम्मत करने के लिए दृष्टिकोण लेता है "इसे हटा दें और मूल डेटा से पुनर्निर्माण करें"। जो एक अनुक्रमण उपकरण के लिए सही समझ बनाता है। लेकिन इसके लिए आपको कहीं और डेटा संग्रहीत करने की आवश्यकता होती है।

+0

यह एक अच्छा बिंदु है ... – RameshVel

3

The Guardian uses Solr as their data store। आप उस स्लाइड शो में उनके कुछ कारण देख सकते हैं।

किसी भी मामले में, मुझे लगता है कि उनकी वेबसाइट बहुत भारी तस्करी है (निश्चित रूप से मैं जो भी काम करता हूं उससे कहीं अधिक है), इसलिए मुझे लगता है कि मैं यह कहकर सहज महसूस करूँगा कि सोलर शायद आपके लिए काम करेगा। क्योंकि यह उनकी आवश्यकताओं के अनुरूप है ।

+0

स्लाइड शो के अनुसार, गार्जियन अभी भी एक रिलेशनल डेटा स्टोर का उपयोग करता है। सौर का उपयोग डेटाबेस के रूप में किया जाता है जो उनके एपीआई को शक्ति देता है। – anon

संबंधित मुद्दे