मैपरेडस की शक्ति का प्रदर्शन करने में उपयोग किए जाने वाले मुख्य उदाहरणों में से एक Terasort benchmark है। मुझे MapReduce पर्यावरण में उपयोग किए गए सॉर्टिंग एल्गोरिदम की मूल बातें समझने में परेशानी हो रही है।MapReduce सॉर्ट एल्गोरिदम कैसे काम करता है?
मुझे सॉर्ट करने के लिए बस अन्य सभी तत्वों के संबंध में किसी तत्व की सापेक्ष स्थिति निर्धारित करना शामिल है। तो सॉर्टिंग में "सबकुछ" के साथ "सबकुछ" की तुलना करना शामिल है। आपका औसत सॉर्टिंग एल्गोरिदम (त्वरित, बबल, ...) बस इसे स्मार्ट तरीके से करता है।
मेरे दिमाग में डेटासेट को कई टुकड़ों में विभाजित करने का अर्थ है कि आप एक टुकड़ा को सॉर्ट कर सकते हैं और फिर भी आपको इन टुकड़ों को 'पूर्ण' पूरी तरह सॉर्ट किए गए डेटासेट में एकीकृत करना होगा। हजारों प्रणालियों में वितरित टेराबाइट डेटासेट को देखते हुए मुझे उम्मीद है कि यह एक बड़ा काम होगा।
तो यह वास्तव में कैसे किया जाता है? यह MapReduce सॉर्टिंग एल्गोरिदम कैसे काम करता है?
मुझे समझने में मदद के लिए धन्यवाद।
मैं निर्दिष्ट दस्तावेजों में वर्णित मैपरेडस की अवधारणाओं (अधिकांश) को समझता हूं। मैं सॉर्टिंग एल्गोरिदम को समझने की कोशिश कर रहा हूं। –