I want to know the relationship between HDFS and databases.
वहाँ 2. के बीच इस तरह के रूप में कोई relation
आप अभी भी कुछ समानता, केवल एक चीज है जो आम है 2 के बीच store
आंकड़ों के प्रावधान नहीं है पता लगाना चाहते हैं है। लेकिन यह किसी भी एफएस और डीबी संयोजन के समान है। उदाहरण के लिए, MySQL और ext3। आप कहते हैं कि आप MySQL में डेटा संग्रहीत कर रहे हैं, लेकिन आखिरकार आपका डेटा आपके एफएस पर संग्रहीत होने में है। आम तौर पर लोग एचडीएफएस द्वारा प्रदान समानांतरता और वितरित व्यवहार का फायदा उठाने के लिए अपने हडोप क्लस्टर के शीर्ष पर एचबीएसई जैसे नोएसक्यूएल डेटाबेस का उपयोग करते हैं।
Is it always necessary that to use HDFS, the data be in a some NoSQL format?
वास्तव में NoSQL format
जैसी कोई चीज़ नहीं है। आप डेटा, पाठ, द्विआधारी, किसी भी प्रकार के HDFS उपयोग कर सकते हैं एक्सएमएल आदि आदि
Is there a specific database that always comes attached when using HDFS?
नहीं। केवल एक चीज है जो HDFS के साथ मिलकर आता MapReduce framework
है। आप एचडीएफएस के साथ काम करने के लिए स्पष्ट रूप से डीबी बना सकते हैं। लोग अक्सर एचडीएफएस के शीर्ष पर नोएसक्यूएल डीबी का उपयोग करते हैं। कैसंद्रा, एचबीज़ इत्यादि जैसे कई विकल्प हैं। यह तय करने के लिए कि आप किस का उपयोग करना चाहते हैं, यह पूरी तरह से आपके ऊपर है।
Can I use a relational database as the native database for Hadoop?
कोई ओओटीबी सुविधा नहीं है जो इसकी अनुमति देता है।इसके अलावा, यह हडोप के साथ आरडीबीएमएस का उपयोग करने के लिए ज्यादा समझ में नहीं आता है। हडोप उन समय के लिए विकसित किया गया था जब आरडीबीएमएस उपयुक्त विकल्प नहीं है, जैसे डेटा के पीबी को संभालने, असंगठित डेटा को संभालने आदि। ऐसा कहकर, आपको हडोप को आरडीबीएमबी के प्रतिस्थापन के रूप में नहीं सोचना चाहिए। दोनों के पास पूरी तरह से अलग-अलग लक्ष्य हैं।
संपादित करें:
आम तौर पर लोगों को Hadoop साथ NoSQL डीबीएस (HBase की तरह, कैसेंड्रा) का उपयोग करें। हडूप के साथ इन डीबी का उपयोग केवल विन्यास का मामला है। इसे प्राप्त करने के लिए आपको किसी भी कनेक्टिंग प्रोग्राम की आवश्यकता नहीं है। @ डॉक्टर डैन द्वारा किए गए बिंदु के अलावा, एसक्यूएल डीबी के स्थान पर नोएसक्यूएल डीबी चुनने के पीछे कुछ और कारण हैं। एक बात size
है। इन नोएसक्यूएल डीबी ने बड़ी क्षैतिज स्केलिबिलिटी प्रदान की जो आपको आसानी से डेटा के पीबी स्टोर करने में सक्षम बनाता है। आप परंपरागत प्रणालियों को स्केल कर सकते हैं, लेकिन लंबवत। डेटा का complexity
एक और कारण है। वे स्थान, जहां इन डीबी का उपयोग किया जा रहा है, ज्यादातर अत्यधिक अनियंत्रित डेटा को संभालते हैं जो परंपरागत प्रणालियों का उपयोग करने से निपटना बहुत आसान नहीं है। उदाहरण के लिए, सेंसर डेटा, लॉग डेटा इत्यादि
असल में, मुझे समझ में नहीं आया कि एसक्यूओपी क्यों मौजूद है। हम क्यों नहीं हडोप पर एक SQL डेटा का उपयोग कर सकते हैं।
हालांकि हैडोप आपकी बिगडाटा आवश्यकताओं को संभालने में बहुत अच्छा है, लेकिन यह आपकी सभी आवश्यकताओं का समाधान नहीं है। यह वास्तविक समय की जरूरतों के लिए उपयुक्त नहीं है। मान लीजिए कि आप एक बहुत ही विशाल डेटासेट के साथ एक ऑनलाइन लेनदेन कंपनी हैं। आप पाते हैं कि आप इस डेटा को हडोप का उपयोग करके आसानी से संसाधित कर सकते हैं। लेकिन समस्या यह है कि आप हडोप के साथ ग्राहकों की वास्तविक समय की जरूरतों को पूरा नहीं कर सकते हैं। यह वह जगह है जहां एसक्यूओपी तस्वीर में आता है। यह एक आयात/निर्यात उपकरण है जो आपको SQL डीबी और हाडोप के बीच डेटा स्थानांतरित करने की अनुमति देता है। आप अपने बिगडाटा को अपने हडोप क्लस्टर में ले जा सकते हैं, इसे वहां संसाधित कर सकते हैं और फिर परिणामों को अपने ग्राहकों की वास्तविक समय की ज़रूरतों को पूरा करने के लिए एसक्यूओपीपी का उपयोग करके अपने एसक्यूएलबी में वापस धक्का दे सकते हैं।
एचटीएच
यह मदद करता है। धन्यवाद। मैंने इस बिंदु पर विचार नहीं किया कि हैडोप डेटा को दोहराता है - हां, यह एक SQL डेटाबेस को मूल डेटाबेस के रूप में असंगत बनाता है। – crossvalidator