मैं लाखों एक्सएमएल फाइलों को स्टोर और पुनर्प्राप्त करने का एक आसान तरीका ढूंढ रहा हूं। वर्तमान में सब कुछ फाइल सिस्टम में किया जाता है, जिसमें कुछ प्रदर्शन समस्याएं होती हैं।बिटकस्क सरल और उच्च प्रदर्शन फ़ाइल स्टोर के लिए ठीक है?
हमारी आवश्यकताएँ हैं:
- एक बैच-प्रक्रिया में एक्सएमएल-फ़ाइलों के लाखों लोगों को स्टोर करने की क्षमता। एक्सएमएल फाइलें कुछ मेग्स तक बड़ी हो सकती हैं, जिनमें से अधिकांश 100 केबी-रेंज में हैं।
- आईडी से बहुत तेजी से यादृच्छिक देखने (जैसे दस्तावेज़ URL)
- सुलभ दोनों जावा और पर्ल द्वारा पर सबसे महत्वपूर्ण लिनक्स Distros
- उपलब्ध और Windows
मैं था कई NoSQL पर एक नजर है -Platforms (जैसे CouchDB, Riak और अन्य), और जब उन प्रणालियों बहुत अच्छी लग रही है, वे लगभग overkill beeing की तरह लग:
- नहीं क्लस्टरिंग आवश्यक
- नहीं डेमॉन ("सेवा") की आवश्यकता
- कोई चतुर खोज की कार्यक्षमता की आवश्यकता
करने के बाद Riak में गहरी delved, मैं Bitcask (intro देखें) है, जो है कि मैं वास्तव में क्या चाहते हैं लगता है मिल गया है। परिचय में वर्णित मूल बातें वास्तव में दिलचस्प हैं। लेकिन दुर्भाग्य से वहाँ जावा के माध्यम से एक bitcask रेपो उपयोग करने के लिए किसी भी तरह है (या नहीं है?)
सू मेरे सवाल
- है निम्नलिखित धारणा सही करने पर निर्भर करता: Bitcask मॉडल (केवल संलग्न लिखते हैं, इन-मेमोरी कुंजी प्रबंधन) लाखों दस्तावेज़ों को संग्रहीत/पुनर्प्राप्त करने का सही तरीका है
- जावा के माध्यम से उपलब्ध बिटकस्क के लिए कोई व्यवहार्य विकल्प हैं? (BerkleyDB दिमाग में आता है ...)
- (दंगा विशेषज्ञों के लिए) क्या "नग्न" बिटकास्क की तुलना में Riak बहुत अधिक ओवरहेड कार्यान्वयन/प्रबंधन/संसाधनानुसार है?
ओवरकिल के लिए। यदि वे उपयोग करने में आसान हैं, और शायद एम्बेड किए जा सकते हैं, तो वे भी एक अच्छा फिट हो सकते हैं ... और भी कम क्या कर सकते हैं। –