में अंतिम अद्यतन फ़ाइल प्राप्त करें मैं अपनी एचडीएफएस निर्देशिकाओं में से एक से नवीनतम अद्यतन फ़ाइल चाहता हूं। कोड को मूल रूप से निर्देशिकाओं और उप निर्देशिकाओं के माध्यम से लूप करना चाहिए और फ़ाइल नाम के साथ नवीनतम फ़ाइल पथ प्राप्त करना चाहिए। मैं स्थानीय फ़ाइल सिस्टम में नवीनतम फ़ाइल प्राप्त करने में सक्षम था लेकिन यह सुनिश्चित नहीं करता कि एचडीएफएस एक के लिए इसे कैसे किया जाए।एचडीएफएस
find /tmp/sdsa -type f -print0 | xargs -0 stat --format '%Y :%y %n' | sort -nr | cut -d: -f2- | head
ऊपर कोड स्थानीय फाइल सिस्टम के लिए काम कर रहा है। मैं एचडीएफएस से दिनांक, समय और फ़ाइल नाम प्राप्त करने में सक्षम हूं, लेकिन इन 3 पैरामीटर का उपयोग करके मैं नवीनतम फ़ाइल कैसे प्राप्त करूं?
hadoop fs -ls -R /tmp/apps | awk -F" " '{print $6" "$7" "$8}'
किसी भी मदद की सराहना की जाएगी:
इस कोड को मैंने कोशिश की है।
अग्रिम धन्यवाद।