मैं Hadoop in Action पढ़ सकते हैं और पाया गया कि Java
में उपयोग कर MultipleOutputFormat
और MultipleOutputs
कक्षाओं हम एक से अधिक फ़ाइलों के लिए डेटा को कम कर सकते हैं, लेकिन क्या मुझे यकीन है कि नहीं कर रहा हूँ कैसे करने के लिए है (जावा हालांकि साथ इसके संभावित) एकाधिक आउटपुट से कम करने के लिए? Python streaming
का उपयोग कर एक ही चीज़ प्राप्त करें।अजगर स्ट्रीमिंग: कैसे
:
/out1/part-0000
mapper -> reducer
\ out2/part-0000
किसी को भी जानता है, सुना है, किया समान बात है, मुझे पता है
मैं इसका उपयोग कैसे करूं? बस जार डाउनलोड करें, किसी भी मानचित्र को प्रभावित किए बिना "-libjar feathers.jar" दें/नौकरी कम करें जो मैंने अभी तक लिखा है? कोई नमूना परीक्षण कोड जिसे मैं चलाने के लिए संदर्भित कर सकता हूं, उपयोगी होगा – daydreamer