मैंने अभी हॉर्टनवर्क्स सैंडबॉक्स वीएम डाउनलोड किया है, इसके अंदर संस्करण 2.7.1 के साथ हैडोप हैं। मैंएचडीएफएस से फ़ाइलों को कैसे हटाएं?
hadoop fs -put /hw1/* /hw1
... आदेश का उपयोग कर कुछ फाइलें जोड़ रहा हूं। यह बाद मैं जोड़ा फ़ाइलों को हटाने कर रहा हूँ, द्वारा
hadoop fs -rm /hw1/*
... आदेश, और यह के बाद रीसायकल बिन सफाई, द्वारा
hadoop fs -expunge
... आदेश। लेकिन रेसील बिन साफ करने के बाद डीएफएस शेष स्थान नहीं बदला गया। यहां तक कि मैं देख सकता हूं कि डेटा वास्तव में/hw1/और recyle bin से हटा दिया गया था। मेरे पास fs.trash.interval parameter = 1
है।
दरअसल मैं /hadoop/hdfs/data/current/BP-2048114545-10.0.2.15-1445949559569/current/finalized/subdir0/subdir2
फ़ोल्डर में भाग में अपने सभी डेटा विभाजित कर सकता हूं, और यह वास्तव में मुझे आश्चर्यचकित करता है, क्योंकि मुझे उम्मीद है कि उन्हें हटाया जाएगा।
तो मेरा सवाल है कि डेटा को कैसे हटाया जाए, जिस तरह से वे वास्तव में हटा दिए जाएंगे? कुछ जोड़ने और हटाने के बाद मैं थका हुआ खाली स्थान मिला।
इसका मतलब यह 'namenode' नष्ट कर दिया मेटाडाटा लेकिन' datanode' डेटा नहीं हटाया था। त्रुटियों या चेतावनियों के लिए अपने 'namenode' और' datanode' लॉग देखें। 'Hdfs dfsadmin -report' चलाने का प्रयास करें और देखें कि क्या आपको कोई उपयोगी जानकारी मिलती है या नहीं। – alvits
बहीखाता करने में कुछ समय लगेगा। –
हैडोप सामग्री को थ्रैश निर्देशिका पर -rm कमांड पर ले जाता है। यदि आप फ़ोल्डरों को स्थायी रूप से हटाना चाहते हैं तो आपको 'hadoop fs -rm -skipTrash/hw1/* ' –