क्या आर में कोई तरीका है बस कुछ के लिए Google खोजना और फिर परिणामों की संख्या वापस करना? मैंने Google की कुछ सेवा (RGoogleDocs, RGoogleData, RGoogleMaps, googleVis) के आस-पास आर पैकेजों को देखा है, लेकिन मुझे यह सुविधा कहीं भी नहीं मिल रही है।आर: Google के लिए स्ट्रिंग और हिट की वापसी संख्या
उत्तर
यही वह है जो मैं उपयोग करता हूं, लेकिन यह एक एपीआई प्रोटोकॉल पर आधारित है जिसे अंततः चरणबद्ध किया जा रहा है। यह भी सीमित है, मैं 100 खोज/दिन पर विश्वास करता हूं। नीचे दिए गए फ़ंक्शन में, सेवा "वेब" है; आपको http://code.google.com/apis/loader/signup.html से कोई कुंजी प्राप्त करने की आवश्यकता होगी (कोई यूआरएल काम करेगा)।
GetGoogleResults <- function(keyword, service, key) {
library(RCurl)
library(rjson)
base_url <- "http://ajax.googleapis.com/ajax/services/search/"
keyword <- gsub(" ", "+", keyword)
query <- paste(base_url, service, "?v=1.0&q=", keyword, sep="")
if(!is.null(key))
query <- paste(query, "&key=", key, sep="")
query <- paste(query, "&start=", 0, sep="")
results <- fromJSON(getURL(query))
return(results)
}
उसके बाद, आप की तरह
google <- GetGoogleResults("searchTerm", "web", yourkey)
str(google)
कुछ करना आप परिणाम की संरचना बता देगा कर सकते हैं। यदि आप केवल परिणामों की संख्या चाहते हैं, तो आप google$responseData$cursor$estimatedResultCount
का उपयोग कर सकते हैं।
जैसा कि मैंने कहा, यह एक प्रोटोकॉल पर आधारित है जो कुछ दिन शैली से बाहर हो सकता है। प्रति डिर्क के जवाब में, कस्टम खोज इंजन का उपयोग करके एक वैकल्पिक दृष्टिकोण है जिसका आप उपयोग कर सकते हैं, लेकिन यह भी सीमित है (यदि आप इस विधि के लिए कोई फ़ंक्शन चाहते हैं, तो आप मुझे noah_at_noahhl.com पर पिंग कर सकते हैं)।
अंतिम, और नहीं सीमित दर, जिस तरह से सिर्फ RCurl उपयोग करने के लिए गूगल से एक पृष्ठ पर प्राप्त करने के लिए है, लेकिन यह बहुत पार्स करने के लिए गंदा है, और एक उपयोगकर्ता एजेंट स्पूफिंग को ऐसा करने से लोगों को रोकने के लिए गूगल के प्रयास से बचने के लिए की आवश्यकता है। (मैं इस कोड को भी साझा कर सकता हूं, लेकिन जब भी Google उनके किसी भी HTML को ट्वीक करता है तो यह टूट जाता है)।
मैं बस जोड़ दूंगा - यह एक समस्या है जिसे मैंने कुछ बार चलाया है। यदि पर्याप्त रुचि है, तो मैं अपने सभी बिट्स और टुकड़ों को पैकेज कर दूंगा और इसे एक वास्तविक पैकेज बनाउंगा। – Noah
बहुत बढ़िया! मुझे दो क्वेरी असाइनमेंट के बीच 'else' दर्ज करना पड़ा था, लेकिन इसके अलावा यह वही है जो मैं ढूंढ रहा था, धन्यवाद! –
अच्छा पकड़, मेरा बुरा - मैंने इस टुकड़े को एक बड़े समारोह से बाहर ले लिया जो परिणाम के माध्यम से अधिक परिणाम प्राप्त करने के लिए परिणाम देता है। "अन्य" कोडिंग करने के बजाय, शून्य के साथ startpos
को प्रतिस्थापित करें। –
Noah
आप Google Custom Search API प्रलेखन पर शुरू और फिर आप इसे हिट करने के लिए सीखने के लिए :)
वहाँ जगह कुछ जा रहा प्राप्त करने के लिए पर्याप्त अनुसंधान बुनियादी ढांचे होना चाहिए कितना JSON कर सकते हैं।
धन्यवाद! मैं इसे देखूंगा –
- 1. स्ट्रिंग घटनाओं की संख्या गिनती
- 2. बड़ी संख्या में भूखंडों की व्यवस्था और आर
- 3. Google मैप्स एपीआई पेज स्पीड हिट
- 4. बैश के साथ पार्स स्ट्रिंग और निकालने की संख्या
- 5. वापसी की गई स्ट्रिंग (YYYYMMDD) को
- 6. SQL क्वेरी और अंत में गाड़ी वापसी एक स्ट्रिंग में एक गाड़ी वापसी के लिए
- 7. पाइथन रेगेक्स एक पैटर्न के रूप में एक स्ट्रिंग से मिलान करने के लिए और वापसी संख्या
- 8. फ़ंक्शन की वापसी के लिए Decltype
- 9. हिट
- 10. आर: पंक्तियों की अज्ञात संख्या के साथ एक मैट्रिक्स बनाना
- 11. आर स्ट्रिंग
- 12. आर: स्ट्रिंग
- 13. Clojure स्ट्रिंग वापसी
- 14. DocumentBuilder पार्स टूटता स्ट्रिंग जब हिट '&'
- 15. आर में स्तंभ संख्या स्तंभ नाम
- 16. (जावा) बिट्स (लम्बाई) की संख्या निर्दिष्ट करें जब स्ट्रिंग के लिए द्विआधारी संख्या परिवर्तित?
- 17. अद्यतन विवरणों से प्रभावित पंक्तियों की वापसी संख्या
- 18. रूबी स्ट्रिंग # वापसी के बराबर स्कैन मैचडाटा
- 19. किसी ऑब्जेक्ट के "पृष्ठ दृश्य" या "हिट" की संख्या ट्रैक करें?
- 20. वेबसाइट के लिए जावास्क्रिप्ट हिट काउंटर
- 21. आउटपुट स्ट्रिंग अक्षरों की कुल संख्या
- 22. आर में एक स्ट्रिंग की लंबाई कैसे खोजें?
- 23. गाड़ी वापसी स्ट्रिंग संसाधन के लिए WPF में
- 24. तारों की वापसी सरणी
- 25. स्ट्रिंग या स्ट्रिंगबिल्डर वापसी मान?
- 26. आर गद्दी 0 एक स्ट्रिंग
- 27. बैश कमांड और वापसी की स्थिति
- 28. आर-मूल्य संदर्भ वापसी प्रकार semantics?
- 29. तुलना संख्या और इसकी स्ट्रिंग प्रस्तुति
- 30. क्यों स्ट्रिंग। लम्बाई वापसी अपरिभाषित?
हां, मुझे लगता है कि मुझे याद है कि Google के लिए इसके लिए एक एपीआई है लेकिन मुझे पैकेज देखने को याद नहीं है। अन्य RGoogleFoo पैकेजों का अध्ययन करके आप कुछ पका सकते हैं। –