मैं हडोप/चिड़ियाघर के लिए नया हूं। मैं हूओप के साथ चिड़ियाघर का उपयोग करने के उद्देश्य को समझ नहीं सकता, क्या हूओप में ज़ूकीपर लिखने वाला डेटा है? यदि नहीं, तो हम हूओप के साथ चिड़ियाघर का उपयोग क्यों करते हैं?हमें हडोप स्टैक में ज़ूकीपर की आवश्यकता क्यों है?
उत्तर
हैडोप 1.x जुकीपर का उपयोग नहीं करता है। एचबीएएस हडोप 1.x इंस्टॉलेशन में भी ज़ूकीपर का उपयोग करता है।
हैडोप ने ज़ूकीपर को संस्करण 2.0 के साथ शुरू किया।
जुकीपर का उद्देश्य क्लस्टर प्रबंधन है। यह छोटे विशिष्ट घटकों का उपयोग करने के * निक्स के सामान्य दर्शन के साथ फिट बैठता है - इसलिए हडोप के घटक जो क्लस्टरिंग क्षमताओं को चाहते हैं, उनके लिए ज़ूकीपर पर भरोसा करते हैं।
Zookeeper एक वितरित भंडारण कि निम्नलिखित की गारंटी देता है प्रदान करता है (Zookeeper overview page से नकल) है:
- अनुक्रमिक संगति - एक ग्राहक से अपडेट आदेश है कि वे भेजा गया था में लागू किया जाएगा।
- परमाणुता - अपडेट या तो सफल होते हैं या विफल हो जाते हैं। कोई आंशिक परिणाम नहीं।
- एकल सिस्टम छवि - एक ग्राहक सेवा के समान दृश्य को देखेगा, चाहे वह से कनेक्ट हो।
- विश्वसनीयता - एक बार अपडेट लागू हो जाने पर, यह उस समय से जारी रहेगा जब तक कोई ग्राहक अद्यतन को ओवरराइट नहीं करता।
- समयबद्धता - सिस्टम के क्लाइंट व्यू को एक निश्चित समय सीमा के भीतर अद्यतित होने की गारंटी है।
आप इन विभिन्न लागू करने के लिए "recipes" ताले की तरह क्लस्टर प्रबंधन, नेता चुनाव आदि
आप चिड़ियाघर संचालक अपने आप को उपयोग करने के लिए जा रहे हैं, मैं तुम्हें पर एक नज़र लेने की सलाह देते के लिए आवश्यक हैं कि उपयोग कर सकते हैं Curator from Netflix जो यह आसान उपयोग करने के लिए
जब आप कहते हैं कि 'Hadoop अपनाया Zookeeper रूप में अच्छी तरह संस्करण 2.0 के साथ शुरू।', इसका मतलब यह है चिड़ियाघर संचालक ver 2.0 बाद Hadoop वितरण में शामिल है? – user3282777
चूंकि ज्यादातर वितरण HBase शामिल यह v.2 से पहले नहीं थी। वी 2 में। यार्न भी हा (वास्तव में आप कम विश्वसनीय तरीकों का उपयोग कर सकते हैं, लेकिन यह सुझाया गया तरीका है, उदाहरण के लिए http://blog.cloudera.com/blog/2014/05/how-apache-hadoop-yarn-ha-works देखने के लिए चिड़ियाघर संचालक का उपयोग करता है /) इसलिए मुझे नहीं लगता कि आप –
धन्यवाद के बिना वितरण ढूंढेंगे या बनाएंगे। क्लौडेरा ब्लॉग काफी जानकारीपूर्ण था। – user3282777
जुकीपर विश्वसनीय वितरित समन्वय की समस्या हल करता है, और हैडोप एक वितरित प्रणाली है, है ना?
एक उत्कृष्ट पेपर Paxos Algorithm है जिसे आप इस विषय पर पढ़ सकते हैं।
+1 Paxos के लिए संदर्भ – grinch
ढेर अतिप्रवाह 101: ज्यादातर मामलों में छोटा ही बेहतर –
(जैसे वे बॉक्स से बाहर कुछ व्यंजनों को लागू) zookeeper प्रलेखन पृष्ठ से बनाता है:
चिड़ियाघर संचालक एक केंद्रीकृत रों है कॉन्फ़िगरेशन जानकारी, नामकरण, वितरित सिंक्रनाइज़ेशन प्रदान करने और समूह सेवाओं को प्रदान करने के लिए सेवा। इन सभी प्रकार की सेवाओं का उपयोग वितरित अनुप्रयोगों द्वारा किसी रूप में या किसी अन्य रूप में किया जाता है।
हर बार जब उन्हें लागू किया जाता है तो वहां बहुत सारे काम होते हैं जो बग और दौड़ की स्थितियों को ठीक करने में सक्षम होते हैं जो अनिवार्य हैं। इन प्रकार की सेवाओं को लागू करने में कठिनाई के कारण, अनुप्रयोगों में शुरुआत में आमतौर पर उन पर कंजूसी होती है, जो उन्हें परिवर्तन की उपस्थिति और प्रबंधन में मुश्किल होती है। यहां तक कि जब सही तरीके से किया जाता है, तब भी इन सेवाओं के विभिन्न कार्यान्वयन के लिए प्रबंधन जटिलता होती है जब अनुप्रयोग तैनात किए जाते हैं।
अपाचे ™ Hadoop® परियोजना विश्वसनीय, स्केलेबल, वितरित अभिकलन के लिए ओपन सोर्स सॉफ्टवेयर विकसित करता है:
hadoop प्रलेखन पृष्ठ से।
क्यों हम की जरूरत है:
The Apache Hadoop सॉफ्टवेयर पुस्तकालय एक रूपरेखा है कि सरल प्रोग्रामिंग मॉडल
आपकी क्वेरी के बारे में उपयोग करने वाले कंप्यूटर के समूहों भर में बड़े डेटा सेट के वितरित प्रसंस्करण के लिए अनुमति देता है हडोप स्टैक में चिड़ियाघर?
बाध्यकारी कारक प्रसंस्करण और उच्च उपलब्धता वितरित किया जाता है।
उदा। Hadoop Namenode प्रक्रिया में विफल।
Hadoop उच्च उपलब्धता प्रक्रिया पर असफल लिए चारों ओर सक्रिय Namenode & स्टैंडबाय Namenode बनाया गया है। किसी भी समय, आपके पास एक ही समय में दो स्वामी (सक्रिय नामनोड्स) नहीं होना चाहिए।
अपाचे दस्तावेज़ीकरण लिंक सेHDFSHighAvailabilityWithQJM पर:
यह एक हा क्लस्टर कि NameNodes का केवल एक एक समय में सक्रिय हो के सही संचालन के लिए महत्वपूर्ण है। अन्यथा, नेमस्पेस स्थिति तेजी से डेटा हानि या अन्य गलत परिणामों को खतरे में डालकर दोनों के बीच अलग हो जाएगी। इस संपत्ति को सुनिश्चित करने और तथाकथित "विभाजन-मस्तिष्क परिदृश्य" को रोकने के लिए, जर्नल नोड्स कभी भी एक ही नाम नोड को एक समय में लेखक होने की अनुमति देगा।
एक विफलता के दौरान, नाम नोड जो सक्रिय होना है, वह जर्नल नोड्स को लिखने की भूमिका निभाएगा, जो सक्रिय रूप से अन्य नाम नोड को सक्रिय स्थिति में जारी रखने से रोक देगा, जिससे नई सक्रिय सुरक्षित रूप से विफलता के साथ आगे बढ़ने की अनुमति देगी। ।
स्प्लिट - मस्तिष्क परिदृश्य से बचने के लिए जुकीपर का उपयोग किया गया है। आप नीचे दिए गए प्रश्न में Zookeeper की भूमिका पा सकते हैं:
- 1. हमें लक्ष्य नामस्थान की आवश्यकता क्यों है?
- 2. हमें "आउट" पैरामीटर की आवश्यकता क्यों है?
- 3. हमें "हटाएं []" ऑपरेटर की आवश्यकता क्यों है?
- 4. हमें फ़ील्ड टैग की आवश्यकता क्यों है?
- 5. हमें यहां टाइपनाम की आवश्यकता क्यों है?
- 6. हमें सी # प्रतिनिधियों की आवश्यकता क्यों है
- 7. हमें वेब-सॉकेट की आवश्यकता क्यों है?
- 8. हमें डिज़ाइन पैटर्न की आवश्यकता क्यों है
- 9. हमें संरचना की आवश्यकता क्यों है? (सी #)
- 10. हमें strdup() की आवश्यकता क्यों है?
- 11. हमें हडोप पासवर्ड रहित एसएसएच क्यों चाहिए?
- 12. हमें सजावटी डिजाइन पैटर्न में सजावट की आवश्यकता क्यों है?
- 13. हमें जावा में इंटरफेस की आवश्यकता क्यों है?
- 14. हमें डेटाबेस टेबल्स में ऑडिट कॉलम की आवश्यकता क्यों है?
- 15. हमें सी ++ में शुद्ध आभासी विनाशक की आवश्यकता क्यों है?
- 16. हमें RuntimeException में प्रयास करने की आवश्यकता क्यों नहीं है?
- 17. हमें गतिशील भाषाओं में इंटरफेस की आवश्यकता क्यों नहीं है?
- 18. हमें क्यों जारी रखने की विधि की आवश्यकता है?
- 19. हमें तीसरे पक्ष के निर्माण उपकरण की आवश्यकता क्यों है?
- 20. हमें Nuget जैसे पैकेज प्रबंधक की आवश्यकता क्यों है?
- 21. हमें एक निजी निर्माता की आवश्यकता क्यों है?
- 22. हमें एक अस्थायी डेटाबेस की आवश्यकता क्यों है?
- 23. हमें ब्लॉक मैक्रो के आसपास कोष्ठक की आवश्यकता क्यों है?
- 24. हमें ढांचे के ढांचे की आवश्यकता क्यों है?
- 25. हमें इस विशेष === ऑपरेटर की आवश्यकता क्यों है?
- 26. हमें मॉलोक रिटर्न डालने की आवश्यकता क्यों है?
- 27. हमें मूल क्वेरी बनाने की आवश्यकता क्यों है?
- 28. हमें हडोप प्रोग्राम में आउटपुट कुंजी/मूल्य वर्ग को स्पष्ट रूप से सेट करने की आवश्यकता क्यों है?
- 29. PHP: हमें स्ट्रिंग तुलना फ़ंक्शन की आवश्यकता क्यों है?
- 30. . हमें System.gc(); को कॉल करने की आवश्यकता क्यों है ??
और जहां Zookeeper Hadoop में प्रयोग किया जाता है? –