आर

2012-02-14 6 views
8

का उपयोग कर पीडीएफ फ़ाइल डाउनलोड करने में समस्याएं मैं इंटरनेट से पीडीएफ फ़ाइल डाउनलोड करना चाहता हूं और इसे स्थानीय एचडी में सहेजना चाहता हूं। डाउनलोड करने के बाद, पीडीएफ आउटपुट फ़ाइल में बहुत सारे खाली पृष्ठ हैं। इसे ठीक करने के लिए मुझे क्या करना होगा?आर

उदाहरण:

require(XML) 
url <- ('http://cran.r-project.org/doc/manuals/R-intro.pdf') 
download.file(url, 'introductionToR.pdf') 

अग्रिम धन्यवाद।

इस तरह पश्चिम बंगाल-मोड के साथ
+2

मैं नकल की और अपने कोड चिपकाया और मिल गया 109 पृष्ठों के दस्तावेज के रूप में यह होना चाहिए tabulizer का उपयोग कर के रूप में data.frame pdfs और निर्यात टेबल डाउनलोड कर सकते हैं। हो सकता है कि आपके पीडीएफ व्यूअर में कोई समस्या हो? – vaettchen

+0

मेरे लिए ठीक काम करता है। (आर 2.14.1, लिनक्स - क्या आप 'sessionInfo() 'के परिणाम पोस्ट कर सकते हैं? ऐसा लगता है कि यह दर्शक या कुछ अन्य ओएस मुद्दा होने की संभावना है, क्योंकि यह बहुत ही बुनियादी कार्यक्षमता है ...) वैसे, आप डॉन नहीं करते इसके लिए 'एक्सएमएल' पैकेज की आवश्यकता नहीं है - 'download.file' आधार आर –

+0

पीएस का हिस्सा है। मुझे लगता है कि आप विंडोज पर हैं: '? Download.file' कहता है:" बाइनरी फ़ाइलों को डाउनलोड करने के लिए लिखे गए कोड को 'mode = "wb"' का उपयोग करना चाहिए, लेकिन टेक्स्ट ट्रांसफर द्वारा किए गए समस्याओं को केवल विंडोज़ पर ही देखा जाएगा। " –

उत्तर

23

प्रयास करें:

download.file(url, 'introductionToR.pdf', mode="wb")

मेरे लिए यह इस तरह से काम करता है।

+1

यही है! मोड = 'wb' समस्या हल हो गई। धन्यवाद! – Diogo

+1

इस उत्तर ने मुझे बहुत काम बचाया! (जीत ओएस पर) – userJT

+1

एक स्पष्टीकरण जोड़ने के लिए, 'मोड = "wb" 'फ़ंक्शन को फ़ाइल के बजाय बाइनरी के रूप में व्यवहार करने के लिए कहता है। – Matt

-1

आप पैकेज

https://ropensci.org/tutorials/tabulizer_tutorial.html

install.packages("devtools") 
# on 64-bit Windows 
ghit::install_github(c("ropenscilabs/tabulizerjars", "ropenscilabs/tabulizer"), INSTALL_opts = "--no-multiarch") 
# elsewhere 
ghit::install_github(c("ropenscilabs/tabulizerjars", "ropenscilabs/tabulizer")) 

library(tabulizer) 

f2 <- "https://github.com/leeper/tabulizer/raw/master/inst/examples/data.pdf" 
extract_tables(f2, pages = 1, method = "data.frame")