2016-07-20 11 views
12

मुझे site को पार्स करने की आवश्यकता है, लेकिन मुझे 403 त्रुटि मिली है।पायथन अनुरोध। 403 निषिद्ध

url = 'http://worldagnetwork.com/' 
result = requests.get(url) 
print(result.content.decode()) 

इसका उत्पादन:

<html> 
<head><title>403 Forbidden</title></head> 
<body bgcolor="white"> 
<center><h1>403 Forbidden</h1></center> 
<hr><center>nginx</center> 
</body> 
</html> 

कृपया, का कहना है कि समस्या क्या है यहाँ एक कोड है।

उत्तर

38

ऐसा लगता है कि पृष्ठ GET अनुरोधों को अस्वीकार करता है जो User-Agent की पहचान नहीं करते हैं। मैं एक ब्राउज़र (क्रोम) के साथ पेज का दौरा किया और GET अनुरोध के User-Agent हैडर (डेवलपर टूल का नेटवर्क टैब में देखो) की नकल की:

import requests 
url = 'http://worldagnetwork.com/' 
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36'} 
result = requests.get(url, headers=headers) 
print(result.content.decode()) 

# <!doctype html> 
# <!--[if lt IE 7 ]><html class="no-js ie ie6" lang="en"> <![endif]--> 
# <!--[if IE 7 ]><html class="no-js ie ie7" lang="en"> <![endif]--> 
# <!--[if IE 8 ]><html class="no-js ie ie8" lang="en"> <![endif]--> 
# <!--[if (gte IE 9)|!(IE)]><!--><html class="no-js" lang="en"> <!--<![endif]--> 
# ... 
+0

आपको बहुत बहुत धन्यवाद! –

+0

मेरे लिए काम किया, धन्यवाद –

+0

मुझे नहीं पता कि यह त्रुटि मेरे लिए पॉपअप क्यों शुरू हुई, यह कुछ घंटों पहले काम कर रहा था। लेकिन आप समाधान पूरी तरह से काम किया, धन्यवाद! – rodrigorf

संबंधित मुद्दे