से वापस नहीं करता है, मैंने xpath के माध्यम से कुछ HTML को तोड़ दिया, जिसे मैंने फिर एक एट्री में परिवर्तित कर दिया। इस के लिए कुछ इसी तरह की:lxml.etree, element.text पूरे पाठ को तत्व
<td> text1 <a> link </a> text2 </td>
लेकिन जब मैं element.text कहते हैं, मैं सिर्फ टेक्स्ट 1 मिलता है (यह, वहाँ होना चाहिए जब मैं FireBug में अपनी क्वेरी की जाँच करें, तत्वों के पाठ पर प्रकाश डाला है, दोनों से पहले पाठ और एम्बेडेड लंगर तत्वों के बाद ...
यह करने का एक तरीका है (मेरे छोटे पायथन स्क्रैप प्रोसेसर से कोड स्निपेट)। आश्चर्य है कि यह एक एलएक्सएमएल बग है? – user522034
यहाँ कोड का टुकड़ा है: – user522034
अगर element.tag == "td": \t \t \t \t बच्चों = element.getchildren() \t \t \t \t अगर (बच्चों) लेन> 0: \t \t \t \t \t विषय = (element.text + बच्चों [0] .tail) \t \t \t बाकी \t: \t \t \t \t \t विषय = eleme NT।पाठ \t \t \t \t प्रिंट ("\ tTopic: \ t \ t% s"% विषय) – user522034