WGET

2013-01-23 12 views
5

का उपयोग कर वेबसाइट/निर्देशिका से सभी .tar.gz फ़ाइलों को डाउनलोड करें, इसलिए मैं wget का उपयोग कर किसी वेबसाइट/निर्देशिका से सभी विशिष्ट एक्सटेंशन डाउनलोड करने के लिए उपनाम/स्क्रिप्ट बनाने का प्रयास कर रहा हूं लेकिन मुझे लगता है कि वहां से एक आसान तरीका होना चाहिए मैं किसके साथ आया हूँWGET

अभी कोड मैं गूगल और आदमी पृष्ठों खोज से ले कर आए हैं है:

wget -r -l1 -nH --cut-dirs=2 --no-parent -A.tar.gz --no-directories http://download.openvz.org/template/precreated/ 
उदाहरण में

तो ऊपर मैं से सभी .tar.gz फ़ाइलों को डाउनलोड करने की कोशिश कर रहा हूँ OpenVZ precreated टेम्पलेट निर्देशिका।

उपर्युक्त कोड सही तरीके से काम करता है लेकिन मुझे मैन्युअल रूप से --cut-dirs = 2 निर्दिष्ट करना होगा जो सामान्य रूप से बनाए गए/टेम्पलेट/प्रीक्रिकेटेड/निर्देशिका संरचना को काट देगा और यह robots.txt फ़ाइल को भी डाउनलोड करेगा।

अब यह एक समस्या नहीं है और robots.txt फ़ाइल को निकालना आसान है, लेकिन मुझे आशा थी कि मुझे मैन पेजों में कुछ याद आएगा जो मुझे निर्देशिका संरचना को निर्दिष्ट किए बिना वही काम करने की अनुमति देगा कट आउट ...

समय से पहले किसी भी मदद के लिए धन्यवाद, इसकी बहुत सराहना की गई है!

उत्तर

6

उपयोग -R विकल्प

-R robots.txt,unwanted-file.txt 

उन फ़ाइलों की अस्वीकार सूची के रूप में जिन्हें आप नहीं चाहते हैं (अल्पविराम से अलग)।

स्क्रिप्टिंग के लिए इस रूप में:

URL=http://download.openvz.org/template/precreated/ 
CUTS=`echo ${URL#http://} | awk -F '/' '{print NF -2}'` 
wget -r -l1 -nH --cut-dirs=${CUTS} --no-parent -A.tar.gz --no-directories -R robots.txt ${URL} 

अपने URL में उपनिर्देशिका के आधार पर काम करना चाहिए।

2

मेरा सुझाव है, अगर यह सच में कष्टप्रद है और आप इसे एक बहुत करते हैं, सिर्फ तुम्हारे लिए इसे हटाने के लिए एक बहुत ही कम दो लाइन स्क्रिप्ट लिखने के लिए आ रही है:

wget -r -l1 -nH --cut-dirs=2 --no-parent -A.tar.gz --no-directories http://download.openvz.org/template/precreated/ 
rm robots.txt 
+0

हाँ, लेकिन मैं एक बैश स्क्रिप्ट बनाने की कोशिश कर रहा हूं कि मैं सिर्फ साइट यूआरएल खिला सकता हूं और बाकी कर सकता हूं ... इसलिए संक्षेप में, sh dl.sh tar.gz, और यह सभी .tar डाउनलोड करेगा .gz – sMyles

संबंधित मुद्दे