2011-11-29 8 views
5

में सेलेनियम कमजोर के HTML टेक्स्ट प्रिंट करें मैं वेब-स्क्रैपिंग प्रोजेक्ट के लिए पायथन में सेलेनियम वेबड्राइवर का उपयोग कर रहा हूं।पायथन

सेलेनियम.WebElement के HTML टेक्स्ट को कैसे मुद्रित करें?

मैं रुचि के डेटा निकालने के लिए HTML को पार्स करने के लिए BeautifulSoup का उपयोग करना चाहता हूं।

धन्यवाद

उत्तर

11

यह संभव नहीं है एक WebElement से कच्चे एचटीएमएल मिलता है।

हालांकि आप ब्राउज़र ऑब्जेक्ट से पृष्ठ स्रोत प्राप्त कर सकते हैं हालांकि: browser.page_source

+0

एक अच्छी सुविधा होगी ... – prestomanifesto

+0

इस प्रश्न से मैंने एक ही मुद्दे को कवर किया: http://stackoverflow.com/q/8258529/311220 – Acorn