अस्वीकरण: मैं क्लाउडेरा पर इस गर्मी में प्रशिक्षु (लेकिन मेरे सबसे अच्छे दोस्त के कुछ याहू! :-) पर कर रहे हैं)
याहू वितरण कुछ सबसेट पर है कि वे चलाने Hadoop 20 का एक संस्करण (गया?) है उनके क्लस्टर के। इसमें स्थिरता, बग फिक्स इत्यादि के लिए पैच का एक सेट शामिल है। यह एक स्रोत रिलीज है; इसमें आरपीएम या डेबियन पैकेज आदि जैसे व्यवस्थापक-अनुकूल विशेषताएं नहीं हैं।
क्लौडेरा वितरण आरपीएमएस और डीबीएस (स्रोत भी उपलब्ध है) के रूप में संकुल है। इसका मतलब है कि आप मानक तरीकों, आदि के माध्यम से अपडेट प्राप्त कर सकते हैं। इसमें स्थिरता और बग फिक्स पैच भी शामिल हैं। यह लगातार बनाए रखा जाता है (यह नहीं कहने के लिए याहू का नहीं है - मुझे लगता है कि कोई सिर्फ गिटूब पर जा सकता है और जांच कर सकता है कि आखिरकार इसे अपडेट किया गया था)। यह पिग और हाइव पैकेज भी करता है।
क्लौडेरा का हडोप 20 का वितरण बीटा में है, और 18 को स्थिर माना जाता है (Cloudera blog पर इस पर अधिक)। 18 संस्करण में हाइव और पिग के लिए पैकेज भी शामिल हैं; 20 के लिए, आपको उन्हें स्वयं बनाना होगा (पिग या हाइव की आधिकारिक रिलीज नहीं है जो अभी तक 20 का समर्थन करती हैं, हालांकि पैच मौजूद हैं)। 20 के क्लौडेरा और याहू संस्करणों के बीच महत्वपूर्ण ओवरलैप हो सकता है; दोनों प्रकट होते हैं, ताकि आप जांच सकें। क्लौडेरा के डिस्ट्रोज़ का नवीनतम दस्तावेज http://archive.cloudera.com
याहू उनके वितरण के लिए समर्थन प्रदान नहीं करता है; वे समुदाय के लिए एक सेवा के रूप में अपने पैच किए गए संस्करण प्रदान करते हैं, इसलिए रुचि रखने वाले लोग आंतरिक रूप से याहू चलाते हैं। याहू क्लस्टर के आकार को देखते हुए, यह एक महत्वपूर्ण योगदान है, खासकर यदि आप एक हडोप डेवलपर नहीं हैं जो हर समय जेआईआरए का पालन करता है। क्लौडेरा वाणिज्यिक रूप से उनके वितरण का समर्थन करता है, साथ ही साथ हडोप मेलिंग सूचियों के माध्यम से कुछ समुदाय समर्थन प्रदान करता है और, दूरस्थ-विशिष्ट मुद्दों के लिए, उनके GetSatisfaction पृष्ठ पर।
दोनों वेनिला अपाचे डिस्ट्रो से काफी अलग हैं क्योंकि वे इसे रिलीज़ के बीच में पैच करते हैं (20 के क्लौडेरा संस्करण में 60+ पैच हैं!)।
हॉर्टनवर्क्स याहू से बाहर हो गया है और अब हडोप के लिए समर्थन प्रदान कर रहा है। –