href मैं इस तरह से एचटीएमएल से सभी href चयन करने के लिए BeautifulSoup मॉड्यूल का उपयोग कर रहा:पायथन मॉड्यूल BeautifulSoup निकालने एंकर
def extract_links(html):
soup = BeautifulSoup(html)
anchors = soup.findAll('a')
print anchors
links = []
for a in anchors:
links.append(a['href'])
return links
लेकिन कुछ समय यह इस त्रुटि संदेश से विफल रहा है:
Traceback (most recent call last):
File "C:\py\main.py", line 33, in <module>
urls = extract_links(page)
File "C:\py\main.py", line 11, in extract_links
links.append(a['href'])
File "C:\py\BeautifulSoup.py", line 601, in __getitem__
return self._getAttrMap()[key]
KeyError: 'href'
धन्यवाद, लेकिन अब आईआर यह त्रुटि संदेश लौट: फ़ाइल "C: \ py \ मुख्य
अपने उदाहरण और बदलाव ले रहा है, इस कोड है कि काम करता है .py ", लाइन 34, urls = extract_links (पृष्ठ) फ़ाइल" सी: \ py \ main.py ", लाइन 11, extract_links में अगर 'ak' में 'href'(): टाइप एरर: ' NoneType 'ऑब्जेक्ट कॉल करने योग्य नहीं है –
Michal
@micheal आप अपने शब्दकोश में' ए' टैग डाल रहे हैं जिसमें 'href' विशेषताएँ नहीं हैं। शब्दकोश को खांसी के लिए शब्दकोश पूछने के बजाय जो 'href' विशेषता दे सकता है या नहीं, डेटा से पूछें * इसे * शब्दकोश में डालने से पहले * करता है। – Droogans
मुझे लगता है कि नई त्रुटि इसलिए है क्योंकि एक सुंदर सूप नोड एक शब्दकोश नहीं है, इसलिए 'कुंजी' वह नहीं है जो आप उम्मीद करते हैं। –