संभव डुप्लिकेट:
Decode HTML entities in Python string?एचटीएमएल से बचने वाले पात्रों को बदलने के लिए मैं पायथन का उपयोग कैसे कर सकता हूं?
मैं एक स्ट्रिंग एचटीएमएल भागने पात्रों से भरा है इस तरह के "
, ”
, और —
के रूप में।
क्या कोई पाइथन पुस्तकालय मेरे इन सभी बचने वाले पात्रों को अपने संबंधित वास्तविक पात्रों के साथ बदलने के लिए विश्वसनीय तरीके प्रदान करता है?
उदाहरण के लिए, मैं सभी "
रों रों के साथ "की जगह चाहते
[string.replace] (http://docs.python.org/library/string.html#string.replace) –
उपयोग ब्यूटीफुल सूप: http: // lxml .de/elementsoup.html – sateesh