पर इनपुट के रूप में निर्देशिका प्रदान करें मैं क्लौडेरा हैडोप का उपयोग कर रहा हूं। मैं सरल मैड्रिडस प्रोग्राम चलाने में सक्षम हूं जहां मैं मैपरेडस प्रोग्राम में इनपुट के रूप में एक फ़ाइल प्रदान करता हूं।हडोप: MapReduce नौकरी
इस फ़ाइल में अन्य सभी फ़ाइलों को मैपर फ़ंक्शन द्वारा संसाधित करने के लिए शामिल किया गया है।
लेकिन, मैं एक बिंदु पर अटक गया हूं।
/folder1
- file1.txt
- file2.txt
- file3.txt
मैं कैसे इतना है कि यह है कि निर्देशिका के अंदर प्रत्येक फ़ाइल को प्रोसेस शुरू कर सकते हैं, "/folder1"
के रूप में MapReduce कार्यक्रम के लिए इनपुट पथ निर्दिष्ट कर सकते हैं?
कोई विचार?
संपादित करें:
1) Intiailly, मैं inputFile.txt mapreduce कार्यक्रम के लिए इनपुट के रूप में प्रदान की है। यह पूरी तरह से काम कर रहा था।
>inputFile.txt
file1.txt
file2.txt
file3.txt
2) लेकिन अब, इनपुट फ़ाइल देने के बजाय, मैं कमांड लाइन पर तर्क [0] के रूप में एक इनपुट निर्देशिका प्रदान करना चाहता हूं।
hadoop jar ABC.jar /folder1 /output
काम कर रहे है आप कैसे सबमिट कर रहे हैं/काम बनाने पर एक नज़र है? –
संपादन की जांच करें ..... –
हां ऐसा काम करता है, आपका प्रश्न क्या है? –