Apache Cassandra समर्थन sharding?क्या कैसंद्रा शेर्डिंग का समर्थन करता है?
क्षमा करें कि यह प्रश्न छोटा लगता है, लेकिन मुझे जवाब नहीं मिल रहा है। मैंने पढ़ा है कि कैसंद्रा को आंशिक रूप से जीएई की बिग टेबल के बाद मॉडलिंग किया गया था जो बड़े पैमाने पर shards। लेकिन अधिकांश दस्तावेज जिन्हें मैं वर्तमान में कैसंद्रा पर ढूंढ रहा हूं, ऐसा लगता है कि कैसंड्रा कई मशीनों पर डेटा क्षैतिज रूप से विभाजित नहीं करता है, बल्कि कई डुप्लिकेट मशीनों का समर्थन करता है। इसका मतलब यह होगा कि कैसंद्रा एक अच्छी फिट उच्च उपलब्धता पढ़ता है, लेकिन अगर अंतराल की मात्रा बहुत अधिक हो गई तो अंततः टूट जाएगी।
ठीक है, मुख्य प्रश्न: ओलॉग (एन) समय में ऑपरेटरों से अधिक और कम का उपयोग कर कैसंड्रा पूछताछ की जा सकती है? –
यह इस बात पर निर्भर करता है कि आपने यादृच्छिक या आदेशित विभाजनकर्ता का उपयोग किया है या नहीं। यादृच्छिक विभाजनकर्ता समान रूप से नोड्स में वितरित करेगा, इसलिए यह संभव है कि किसी डेटा क्वेरी को डेटा पुनर्प्राप्त करने के लिए अधिकांश/सभी नोड्स को हिट करने की आवश्यकता होगी ... तो शायद ओ (एन)। ऑर्डर्ड पार्टिशनर कैसंद्रा के साथ निर्धारित कर सकते हैं कि कौन से नोड्स पूछताछ कर सकते हैं और अंगूठी पर सबकुछ वापस कर सकते हैं, लेकिन यह डेटा वितरण (यानी हैलो हॉटस्पॉट) की लागत पर भी किया जाता है। रेंज प्रश्नों को पूरा करने के तरीके हैं (उदाहरण के लिए अपनी खुद की अनुक्रमणिका बनाएं जहां आपकी पंक्ति कुंजी एक कॉलम है)। यह अपने आप में एक और प्रश्न/चर्चा वारंट करता है। –
क्या विभाजित डेटा सभी नोड्स (प्रतिकृति के लिए सेटअप) पर दोहराया जाता है? – user3587180