Hadoop : The Definitive Guide के अनुसार।मानचित्र/डेटा को कम करने में डेटा कैसे खींचें?
नया एपीआई एक "पुश" और पुनरावृत्ति की "पुल" शैली दोनों का समर्थन करता है। दोनों एपीआई में, कुंजी-मूल्य रिकॉर्ड जोड़े को मैपर पर धक्का दिया जाता है, लेकिन इसके अलावा, नया एपीआई मैपर को मानचित्र() विधि के भीतर से रिकॉर्ड खींचने की अनुमति देता है। रेड्यूसर के लिए भी यही है। "पुल" शैली कैसे उपयोगी हो सकती है इसका एक उदाहरण बैच में रिकॉर्ड्स प्रोसेसिंग कर रहा है, बजाय एक-एक करके।
क्या किसी ने मानचित्र/घटाए गए कार्यों में डेटा खींच लिया है? मुझे एपीआई या इसके लिए उदाहरण में दिलचस्पी है।
मुझे लगता है कि यह परिदृश्य तब उपयोगी होगा जब वर्तमान कुंजी/मान की प्रसंस्करण अगले कीवल्यू जोड़ी पर निर्भर होगी। –
यह पुरानी और नई एपीआई के साथ किया जा सकता था। लेकिन, चुनौती उस स्थिति को संभालने में है जब डेटा ब्लॉक में फैलता है। –
आप इसे पुराने एपीआई के साथ कैसे कर सकते हैं? –