मुझे यह xpath क्वेरी मिली है:Lxml, XPath और पायथन का उपयोग कर किसी वेबपृष्ठ से लिंक निकालने के लिए कैसे?
/html/body//tbody/tr[*]/td[*]/a[@title]/@href
यह शीर्षक विशेषता के साथ सभी लिंक निकालता है - और href
में href
देता है।
हालांकि, मैं lxml
के साथ इसका उपयोग नहीं कर सकता।
from lxml import etree
parsedPage = etree.HTML(page) # Create parse tree from valid page.
# Xpath query
hyperlinks = parsedPage.xpath("/html/body//tbody/tr[*]/td[*]/a[@title]/@href")
for x in hyperlinks:
print x # Print links in <a> tags, containing the title attribute
यह lxml
(खाली सूची) से कोई परिणाम नहीं देता है।
एक हाइपरलिंक के href
टेक्स्ट (लिंक) को कैसे ले जाएगा जिसमें पायथन के तहत lxml
के साथ विशेषता शीर्षक शामिल है?
क्या आपके द्वारा पार्स किए जा रहे दस्तावेज़ में नामस्थान (xmlns) सेट है? –