का एक अलग समूह में आकार एन के कैसेंड्रा समूह से डेटा को स्थानांतरित करना .. एक 5 नोड क्लस्टर से 7 नोड क्लस्टर तक।मैं कैसे यह पता लगाने की एक कैसेंड्रा क्लस्टर से डेटा माइग्रेट करने के लिए कैसे, एक अलग अंगूठी आकार का एक और कैसेंड्रा क्लस्टर के लिए कोशिश कर रहा हूँ आकार एन +/- एम
मैं sstable2json पर तलाश शुरू कर दी है, क्योंकि यह है कि विशिष्ट कैसेंड्रा नोड पर SSTable के लिए एक json फ़ाइल बनाता है। मेरा विचार अंगूठी में प्रत्येक नोड पर कॉलम परिवार के लिए ऐसा करना था। तो 5 नोड रिंग पर, यह मुझे 5 जेसन फाइलें देगा, कॉलम परिवार में संग्रहीत डेटा के लिए एक फ़ाइल जो प्रत्येक नोड पर रहता है।
फिर मैं जेसन फाइलों को एक फ़ाइल में विलय कर दूंगा, और आकार के नए क्लस्टर में आयात करने के लिए जेसन 2 एसस्टेबल का उपयोग करूंगा, मैं कहूंगा। मैं उम्मीद कर रहा था कि कैसंड्रा फिर नोड्स में समान रूप से डेटा को दोहराएगा अंगूठी में, लेकिन मैंने अभी पढ़ा है कि एसएसटीबल्स एक बार लिखे गए अपरिवर्तनीय हैं। तो अगर मैंने जो कुछ किया है, मैंने किया है, तो मैं अपने कॉलम परिवार के सभी डेटा के साथ एक नोड पर एक अंगूठी के साथ समाप्त होता हूं।
तो किसी को भी मुझे एक अलग अंगूठी आकार का एक अलग क्लस्टर के लिए एक समूह से डेटा को माइग्रेट करने के लिए प्रक्रिया यह पता लगाने में मदद कर सकते हैं?
है यदि मैं सीधे एसएसटीबल को लिखता हूं, तो क्या कैसंड्रा डेटा को अन्य नोड्स में दोहराएगा? साथ ही, अगर मैं अंगूठी में सभी नोड्स से सभी डेटा फ़ाइलों को एक फ़ोल्डर में डालता हूं, और उस पर sstableloader चलाता हूं, तो क्या मैं डुप्लिकेट डेटा के साथ समाप्त नहीं होता, क्योंकि डेटा को मूल क्लस्टर में 3 नोड्स में दोहराया गया था? – Turbo
हां, आप डुप्लिकेट डेटा के साथ समाप्त हो जाएगा। कॉम्पैक्शन इसका ख्याल रखेगा, इसलिए यह कोई समस्या नहीं है। इसके अलावा: "सभी डेटा फ़ाइलों को एक फ़ोल्डर में डालने की कोई ज़रूरत नहीं है," बस इसे जगह में करें। (स्पष्टीकरण के लिए संपादित।) – jbellis
हे जेबेलिस, जानकारी के लिए धन्यवाद। मुझे लगता है कि यह लेने का मार्ग है। मेरे परिदृश्य के बारे में अधिक जानकारी जोड़ने के लिए, मैं डेटा मॉडल उत्पन्न करने के लिए ec2 पर hadoop का उपयोग कर रहा हूं और इसे ec2 पर भी कैसंड्रा पर जारी रखता हूं। फिर जब मॉडल बनाया गया है, तो मैं अपने नेटवर्क पर कैसंड्रा डेटा खींच रहा हूं। मॉडल उत्पन्न करते समय मैं कुछ स्केलेबिलिटी बेनिफिट प्राप्त करने के लिए ec2 पर काफी बड़ी कैसंड्रा अंगूठी बनाउंगा। लेकिन मेरे नेटवर्क में गंतव्य अंगूठी छोटी होगी, शायद आधे से। तो मेरी योजना है कि डेटा फ़ाइलों को ec2 से नीचे अपने नेटवर्क पर खींचें और फिर डेटा आयात करें। अधिक अगली टिप्पणी ... – Turbo