2011-03-24 18 views
15

मैं वर्तमान में एक डाटास्टोर के रूप में एचबीएस का मूल्यांकन कर रहा हूं, लेकिन एक प्रश्न को अनुत्तरित छोड़ दिया गया था: एचबीएएस एक ही ऑब्जेक्ट की कई प्रतियों को कई नोड्स (उर्फ प्रतिकृति) पर संग्रहीत करता है। चूंकि एचबीएएस में मजबूत स्थिरता (को लगातार संगत) में यह गारंटी देता है कि प्रत्येक प्रतिकृति पढ़ने पर समान मान देता है।एचबीएस: प्रतिकृति कैसे काम करती है?

जैसा कि मैंने मूल्यों को पढ़ते समय एचबीएएस अवधारणा को समझ लिया था, पहले एचबीएस मास्टर के लिए पूछताछ की जाती है (वहां एक से अधिक होना चाहिए) क्षेत्र सर्वर डेटा प्रदान करता है। फिर मैं मास्टर के आविष्कार किए बिना पढ़ने और लिखने के अनुरोध जारी कर सकता हूं। फिर प्रतिकृति कैसे काम कर सकते हैं?

  • एचबीएएस कैसे समन्वय प्रदान करता है?
  • लेखन ऑपरेशन आंतरिक रूप से कैसे काम करते हैं?
  • सभी प्रतिकृतियां लिखे जाने तक ऑपरेशन ब्लॉक लिखें (=> तुल्यकालिक प्रतिकृति)। यदि हां, तो इस स्थानांतरण का प्रबंधन कौन करता है?
  • एचडीएफएस खेल में कैसे आता है?

मैं पहले से ही बिगटेबल -Paper पढ़ लिया है और डॉक्स खोज की है, लेकिन मैं HBase की वास्तुकला पर आगे कोई जानकारी नहीं मिली।

धन्यवाद!

उत्तर

16

hbase जिस तरह से आप सोच रहे हैं उसमें कोई प्रतिकृति नहीं करता है। यह एचडीएफएस के शीर्ष पर बनाया गया है, जो डेटा ब्लॉक के लिए प्रतिकृति प्रदान करता है जो hbase टेबल बनाता है। हालांकि, केवल एक क्षेत्ररक्षक किसी भी पंक्ति के लिए डेटा परोसता है या लिखता है।

आमतौर पर क्षेत्ररक्षक डेटा नोड्स के साथ स्थानांतरित होते हैं। एचडीएफएस में सभी डेटा लिखते हैं, यदि संभव हो तो स्थानीय नोड पर जाएं, एक ही रैक पर एक और नोड, और एक अलग रैक पर एक और नोड (एचडीएफएस में 3 का प्रतिकृति कारक दिया गया)। इसलिए, एक क्षेत्र सर्वर अंततः स्थानीय सर्वर से अपने सभी डेटा के साथ समाप्त हो जाएगा।

अवरुद्ध करने के लिए: केवल ब्लॉक तब तक है जब तक डब्ल्यूएएल (आगे लॉग लिखें) डिस्क पर फ़्लश नहीं किया जाता है। यह guarentees कि लॉग के रूप में कोई डेटा खो गया है हमेशा replayed किया जा सकता है। ध्यान दें कि एचबीएएस के पुराने संस्करण ने यह काम नहीं किया है क्योंकि हाल ही में एचडीएफएस टिकाऊ परिशिष्ट संचालन का समर्थन नहीं करता था। हम इस पल के लिए एक अजीब स्थिति में हैं क्योंकि हडोप का कोई आधिकारिक अपाचे रिलीज नहीं है जो दोनों संलग्न और एचबीएस का समर्थन करता है। इस बीच, आप या तो स्वयं को पैच संलग्न कर सकते हैं, या क्लौडेरा वितरण (अनुशंसित) का उपयोग कर सकते हैं।

एचबीएएस में एक संबंधित प्रतिकृति सुविधा है जो आपको एक क्लस्टर से डेटा को दोहराने की अनुमति देगी।

+0

डेविड, मैं, http://www.cloudera.com/content/cloudera/en/documentation/core/latest/topics/cdh_bdr_hbase_replication.html => इन आदेशों में आए मास्टर पर: "बनाने ' टी 1 ', {NAME =>' f1 ', REPLICATION_SCOPE => 1} " => दास पर: " बनाएं' t1 ', {NAME =>' f1 ', KEEP_DELETED_CELLS =>' true '} " तो इसका मतलब है कि एचबीज़ अपने डेटा के प्रतिकृति को नियंत्रित कर सकता है? –

+1

आपके द्वारा लिंक किए गए एचबीएएस प्रतिकृति का अर्थ डेटा केंद्रों में डेटा को दोहराना है, न कि क्लस्टर में नोड्स में – David

संबंधित मुद्दे