को कम करना है, मैं जानना चाहता हूं कि समूहिंग तुलनित्र माध्यमिक प्रकार के मैड्रिड में क्यों उपयोग किया जाता है।हडूप मानचित्र में समूहीकरण समूह के उपयोग का क्या उपयोग
(उतरते) छँटाई
हम सॉर्ट क्रम कुंजी तापमान वर्ष (आरोही) और फिर से होने के लिए चाहते हैं माध्यमिक की निश्चित गाइड उदाहरण के अनुसार:
1900 35°C
1900 34°C
1900 34°C
...
1901 36°C
1901 35°C
एक की स्थापना करके कुंजी के वर्ष भाग द्वारा विभाजित करने के लिए विभाजनकर्ता, हम गारंटी दे सकते हैं कि उसी वर्ष के लिए रिकॉर्ड उसी रेड्यूसर पर जाएं। हालांकि, यह अभी भी हमारे लक्ष्य को प्राप्त करने के लिए पर्याप्त नहीं है। एक विभाजनकर्ता केवल यह सुनिश्चित करता है कि एक रेड्यूसर को एक वर्ष के लिए सभी रिकॉर्ड प्राप्त हों; यह इस तथ्य को नहीं बदलेगा कि विभाजन के भीतर कुंजी द्वारा reducer समूह।
चूंकि हम पहले से ही अपना स्वयं का विभाजनकर्ता लिख चुके होंगे जो विशेष रूप से रेड्यूसर पर जाने वाले मानचित्र आउटपुट कुंजियों का ख्याल रखेगा, तो हमें इसे क्यों समूहित करना चाहिए।
अग्रिम धन्यवाद
के लिए डेटा को रेड्यूसर में पास किए जाने वाले सभी रविवारों का तापमान अच्छा स्पष्टीकरण .. –