2015-10-30 9 views
5

के साथ Google खोज के पहले लिंक को कैसे स्क्रैप कर सकता हूं, मैं एक ऐसी स्क्रिप्ट बनाने की कोशिश कर रहा हूं जो Google खोज के पहले लिंक को स्क्रैप करेगा ताकि वह मुझे केवल पहला लिंक दे सके ताकि मैं दौड़ सकूं टर्मिनल में एक खोज और खोज शब्द के साथ बाद में लिंक देखें। मैं केवल पहला परिणाम प्राप्त करने के लिए संघर्ष कर रहा हूं। यह अब तक की सबसे नज़दीकी चीज है।मैं सुंदर सूप

import requests 
from bs4 import BeautifulSoup 

research_later = "hiya" 
goog_search = "https://www.google.co.uk/search?sclient=psy-ab&client=ubuntu&hs=k5b&channel=fs&biw=1366&bih=648&noj=1&q=" + research_later 


r = requests.get(goog_search)  
soup = BeautifulSoup(r.text) 

for link in soup.find_all('a'): 
    print research_later + " :"+link.get('href') 
+1

क्यों है गूगल खोज यूआरएल तो इतने सारे विभिन्न मानकों के साथ लंबे समय तक? (मैं सिर्फ उत्सुक हूँ) –

उत्तर

7

गूगल की तरह लगता है लिंक को बचाने के लिए cite टैग का उपयोग, इसलिए हम बिल्कुल soup.find('cite').text इस तरह उपयोग कर सकते हैं:

import requests 
from bs4 import BeautifulSoup 

research_later = "hiya" 
goog_search = "https://www.google.co.uk/search?sclient=psy-ab&client=ubuntu&hs=k5b&channel=fs&biw=1366&bih=648&noj=1&q=" + research_later 


r = requests.get(goog_search) 

soup = BeautifulSoup(r.text, "html.parser") 
print soup.find('cite').text 

आउटपुट है:

www.urbandictionary.com/define.php?term=hiya