2011-03-22 8 views
18

यह इतना बुनियादी सवाल है कि मैं वास्तव में इसे दस्तावेज़ों में नहीं ढूंढ सकता: -/अविश्वसनीय रूप से बुनियादी एलएक्सएमएल प्रश्न: lxml.etree._Element की HTML/स्ट्रिंग सामग्री प्राप्त करना?

निम्न में:

img = house_tree.xpath('//img[@id="mainphoto"]')[0] 

मैं <img/> टैग का HTML कैसे प्राप्त करूं?

मैंने html_content() जोड़ने की कोशिश की है लेकिन AttributeError: 'lxml.etree._Element' object has no attribute 'html_content' प्राप्त करें।

इसके अलावा, यह कुछ सामग्री के साथ एक टैग था (उदा। <p>text</p>) मैं सामग्री कैसे प्राप्त करूं (उदा। text)?

बहुत धन्यवाद!

उत्तर

38

मुझे लगता है यह उतना ही आसान हो जाएगा के रूप में:

from lxml.etree import tostring 
inner_html = tostring(img) 

<p> अंदर से सामग्री प्राप्त करने के लिए के रूप में, कहते हैं, कुछ चयनित तत्व el:

content = el.text_content() 
संबंधित मुद्दे