मैं BeautifulSoup उपयोग कर रहा हूँ एक यूआरएल स्क्रैप करने का और मैं निम्नलिखित कोड थाक्या हम सुंदर सूप के साथ xpath का उपयोग कर सकते हैं?
import urllib
import urllib2
from BeautifulSoup import BeautifulSoup
url = "http://www.example.com/servlet/av/ResultTemplate=AVResult.html"
req = urllib2.Request(url)
response = urllib2.urlopen(req)
the_page = response.read()
soup = BeautifulSoup(the_page)
soup.findAll('td',attrs={'class':'empformbody'})
अब उपरोक्त कोड में हम findAll
उपयोग कर सकते हैं टैग और जानकारी उन्हें से संबंधित प्राप्त करने के लिए, लेकिन मैं xpath उपयोग करना चाहते हैं। क्या सुंदरपॉप के साथ xpath का उपयोग करना संभव है? यदि संभव हो, तो क्या कोई मुझे एक उदाहरण कोड प्रदान कर सकता है ताकि यह और अधिक सहायक हो?
बहुत बहुत धन्यवाद पीटर, मुझे आपके कोड से दो सूचनाएं मिलीं, 1। एक स्पष्टीकरण कि हम बीएस 2 के साथ xpath का उपयोग नहीं कर सकते हैं। Lxml का उपयोग करने के तरीके पर एक अच्छा उदाहरण। क्या हम इसे एक विशेष दस्तावेज़ीकरण पर देख सकते हैं कि "हम लिखित रूप में बीएस का उपयोग करके xpath लागू नहीं कर सकते हैं", क्योंकि हमें उन लोगों को कुछ सबूत दिखाना चाहिए जो स्पष्टीकरण के लिए सही पूछते हैं? –
वैसे भी धन्यवाद आपके लिए preciuos मदद –
नकारात्मक साबित करना मुश्किल है; [सुंदर सूप 4 प्रलेखन] (http://www.crummy.com/software/BeautifulSoup/bs4/doc/) में एक खोज फ़ंक्शन है और 'xpath' के लिए कोई हिट नहीं है। –