में रेफ़रल यूआरएल सेटिंग मैं वेबसाइट डाउनलोड करने के लिए पाइथन में urllib.urlretrieve
का उपयोग कर रहा हूं। हालांकि कुछ वेबसाइटें मुझे नहीं डाउनलोड करना चाहती हैं, जब तक कि उनके पास अपनी साइट से उचित संदर्भकर्ता न हो। क्या किसी को इस तरह से पता है कि मैं पाइथन पुस्तकालयों में से एक या बाहरी में रेफरर सेट कर सकता हूं।पाइथन urllib.urlretrieve
6
A
उत्तर
11
import urllib2
req = urllib2.Request('http://www.example.com/')
req.add_header('Referer', 'http://www.python.org/')
r = urllib2.urlopen(req)
3
urllib
अनुरोध के साथ मनमाने ढंग से शीर्षलेख भेजना मुश्किल बनाता है; आप urllib2 का उपयोग कर सकते हैं, जो आपको Request ऑब्जेक्ट को मनमाने ढंग से शीर्षकों के साथ बनाने और भेजने की सुविधा देता है (बेशक - अलस दुख की वर्तनी ;-) - Referer
)। urlretrieve
की पेशकश नहीं करता है, लेकिन अगर आप चाहते हैं (सीधे, या उदा। shutil फ़ंक्शंस के माध्यम से) के साथ परिणामस्वरूप फ़ाइल-जैसी ऑब्जेक्ट को डिस्क पर कॉपी करें और प्रतिलिपि बनाना urlopen
है।
3
इसके अलावा से अपनाया, build_opener
साथ urllib2
का उपयोग कर आप यह कर सकते हैं:
import urllib2
opener = urllib2.build_opener()
opener.addheaders = [('Referer', 'http://www.python.org/')]
opener.open('http://www.example.com/')
संबंधित मुद्दे
- 1. कैसे पता चलेगा कि urllib.urlretrieve सफल होता है?
- 2. कैसे urllib.urlretrieve में 404 त्रुटि को पकड़ने के लिए
- 3. पाइथन
- 4. पाइथन
- 5. पाइथन
- 6. पाइथन
- 7. पाइथन
- 8. पाइथन
- 9. पाइथन
- 10. पाइथन
- 11. पाइथन
- 12. पाइथन
- 13. पाइथन
- 14. पाइथन
- 15. पाइथन
- 16. पाइथन
- 17. पाइथन
- 18. पाइथन
- 19. पाइथन
- 20. पाइथन
- 21. पाइथन
- 22. पाइथन
- 23. पाइथन
- 24. पाइथन
- 25. पाइथन
- 26. पाइथन
- 27. पाइथन
- 28. पाइथन
- 29. पाइथन
- 30. पाइथन