मैं एक साइट में डॉउलोड वेबपृष्ठों को बैच करना चाहता हूं। मेरी 'urls.txt' फ़ाइल में 5000000 यूआरएल लिंक हैं। यह लगभग 300 मीटर है। इन यूआरएल को एक बहु-थ्रेड कैसे लिंक करते हैं और इन वेबपृष्ठों को कैसे लोड करते हैं? या बैच इन वेबपृष्ठों को कैसे लोड करें?पायथन, बहु-धागे, वेबपृष्ठ लाएं, वेबपृष्ठ डाउनलोड करें
मेरे विचारों:
with open('urls.txt','r') as f:
for el in f:
##fetch these urls
या मुड़?
क्या इसके लिए कोई अच्छा समाधान है?
आप इसे अपने आप को कार्यक्रम करना चाहते हैं? आप इसे 'wget' आसानी से कर सकते हैं। – notnoop