में मैं BeautifulSoup उपयोग कर रहा हूँ एक html पृष्ठ से कुछ सामग्री पार्स करने के लिए।सुझाव() BeautifulSoup
मैं एचटीएमएल से सामग्री मैं चाहता हूँ (अर्थात पाठ एक span
class
MyClass द्वारा परिभाषित में समाहित) निकाल सकते हैं।
<span class="myclass">Lorem ipsum<br/>dolor sit amet,<br/>consectetur...</span>
अगर मैं का उपयोग कर पाठ को निकालने के लिए प्रयास करें::
result.get_text()
मैं प्राप्त:
Lorem ipsumdolor sit amet,consectetur...
आप जब देख सकते हैं
result = mycontent.find(attrs={'class':'myclass'})
मैं इस परिणाम प्राप्त टैग <br>
वहां हटा दिया गया है सामग्री के बीच कोई और दूरी नहीं है और दो शब्दों को समेकित किया जाता है।
मैं इस मुद्दे को कैसे हल कर सकता हूं?
प्रयोग करें 'सामग्री' है, तो
की जगह? – Floris
आप इतना है कि मैं इस सवाल का जवाब स्वीकार कर सकते हैं एक उदाहरण में डाल सकते हैं? धन्यवाद – user601836
अभी आईफोन पर। परीक्षण कोड बनाने के लिए कंप्यूटर के पास जाने की आवश्यकता है। मुझे आशा है कि इस दौरान कोई और आपके लिए उदाहरण बनायेगा। – Floris