के साथ पायथन XPath पार्सिंग टैग मैं XPath के लिए नया हूं। मैं XPath का उपयोग कर एक पेज पार्स करने की कोशिश कर रहा हूं। मुझे टैग से जानकारी प्राप्त करने की ज़रूरत है, लेकिन सब कुछ ऊपर शीर्षक स्क्रू में एस्ट्रोफ़े से बच निकला।एस्ट्रोफ़े
पार्सिंग के लिए मैं Grab का उपयोग करता हूं। स्रोत से
टैग:
<img src='somelink' border='0' alt='commission:Alfred\'s misadventures' title='commission:Alfred\'s misadventures'>
वास्तविक XPath:
g.xpath('.//tr/td/a[3]/img').get('title')
रिटर्न
commission:Alfred\\
तो इसे ठीक करने कोई तरीका है?
धन्यवाद
ईमानदारी से, आपको खुशी होगी कि आपका '.xpath' कुछ भी लौटाता है। यह एचटीएमएल एलएक्सएमएल के 'एचटीएमएल' मॉड्यूल के लिए पर्याप्त अमान्य है जिस पर इसे दबाया जा सकता है। –
मैंने अभी कुछ एलसीएमएल और सुंदर सूप के साथ प्रयोग किया है, और उनमें से कोई भी इसे सही तरीके से पार्स नहीं किया गया है। जाहिर है, विशेषता मानों के लिए बाहरी उद्धरण डबल कोट्स होना चाहिए। एचटीएमएल का स्रोत क्या है? – ekhumoro