2012-01-29 13 views
7

मैं तो एक विकिपीडिया पृष्ठ तक पहुँचने के लिए पृष्ठों की एक सूची प्राप्त करने के लिए कोशिश कर रहा हूँ, और निम्न त्रुटि मिल में:सेटिंग "एक जानकारीपूर्ण उपयोगकर्ता-एजेंट स्ट्रिंग" getURL

library(RCurl) 
u <- "http://en.wikipedia.org/w/index.php?title=Special%3APrefixIndex&prefix=tal&namespace=4" 
getURL(u) 
[1] "Scripts should use an informative User-Agent string with contact information, or they may be IP-blocked without notice.\n" 

मैं उस पृष्ठ पर पहुंचने की उम्मीद है विकिपीडिया एपीआई के माध्यम से, लेकिन I am not sure it would work

और बात है, कि अन्य पन्नों समस्या के बिना पढ़ा रहे हैं, उदाहरण के लिए:

u <- "http://en.wikipedia.org/wiki/Wikipedia:Talk" 
getURL(u) 

कोई सुझाव?

साइड नोट: सामान्य में मैं नहीं बल्कि विकी पृष्ठों स्क्रैप होगा नहीं और एपीआई के माध्यम से जाना है, लेकिन मुझे डर है कि इस विशिष्ट पृष्ठों अभी तक एपीआई के माध्यम से उपलब्ध नहीं हैं ...

उत्तर

13

the documentation of RCurl के अनुसार, आप कर सकते हैं httpheader पैरामीटर जोड़कर अतिरिक्त शीर्षलेख निर्दिष्ट करें:

getURL(u, httpheader = c('User-Agent' = "Informative string with your contact info")) 
+0

बिल्कुल सही - धन्यवाद! –

संबंधित मुद्दे