मैं वेबपृष्ठों का विश्लेषण करने और टर्मिनल पर देखे गए वेबपृष्ठों के नाम को प्रिंट करने के लिए सुंदर सूप का उपयोग कर रहा हूं। हालांकि, अक्सर वेबपृष्ठ के नाम पर एक ही दाएं (\ u2018) और (\ u2019) वर्ण जो पाइथन प्रिंट नहीं कर सकता है क्योंकि यह आकर्षक एन्कोडिंग त्रुटि देता है। क्या इन पात्रों को हटाने का कोई तरीका है?हटा रहा है u2018 और u2019 चरित्र
15
A
उत्तर
26
ये कोड एकल बाएं और दाएं उद्धरण वर्णों के लिए यूनिकोड हैं। आप जो अजगर किसी भी समस्या के लिए अपने सिस्टम पर प्रिंट नहीं करना चाहिए था उनके ASCII बराबर के साथ उन्हें जगह ले सकता है:
>>> print u"\u2018Hi\u2019"
‘Hi’
>>> print u"\u2018Hi\u2019".replace(u"\u2018", "'").replace(u"\u2019", "'")
'Hi'
वैकल्पिक रूप से regex के साथ
:
import re
s = u"\u2018Hi\u2019"
>>> print re.sub(u"(\u2018|\u2019)", "'", s)
'Hi'
हालांकि अजगर किसी भी समस्या यूनिकोड मुद्रण नहीं होना चाहिए इनके संस्करण भी। यह संभव है कि आप str()
कहीं भी उपयोग कर रहे हैं जो आपके यूनिकोड को एएससीआई में बदलने और अपना अपवाद फेंकने का प्रयास करेगा।
संबंधित मुद्दे
- 1. गिट: एक फ़ाइल को संस्करणित करने से हटा रहा है, लेकिन इसे हटा नहीं रहा है
- 2. स्ट्रिंग से nonnumeric और nonalpha अक्षर को हटा रहा है?
- 3. एंड्रॉइड - घर और नेविगेशन बटन को हटा रहा है
- 4. आईफोन और कोर डेटा - NSManagedObject को हटा रहा है?
- 5. स्ट्रिंग से सबस्ट्रिंग को हटा रहा है?
- 6. गिट रिपोजिटरी गिटोलाइट को हटा रहा है?
- 7. ActiveAdmin संसाधनों को हटा रहा है
- 8. स्ट्रिंग से संख्याओं को हटा रहा है?
- 9. अस्थायी ASP.Net फ़ाइलों को हटा रहा है
- 10. विंडो सीमा को हटा रहा है?
- 11. प्रस्तावना: डुप्लिकेट को हटा रहा है
- 12. jQuery Accordion आइटम को हटा रहा है
- 13. jquery.ValidationEngine - त्रुटि पॉपअप को हटा रहा है
- 14. mysql_real_escape_string पूरे स्ट्रिंग को हटा रहा है
- 15. फ़ाइल से नियंत्रण कक्ष हटा रहा है
- 16. डी 3: तत्वों को हटा रहा है
- 17. phpMyAdmin एक सूचकांक को हटा रहा है
- 18. लूप को अनुकूलित/हटा रहा है
- 19. एयरफ्लो कार्य लॉग को हटा रहा है
- 20. एक स्ट्रिंग से दो अक्षरों को हटा रहा है
- 21. यूनिकोडएनकोडरर: 'charmap' कोडेक चरित्र चरित्र मानचित्र को <undefined>
- 22. विशेष चरित्र और
- 23. वर्णमाला और चरित्र एन्कोडिंग
- 24. फ्रेट्स और यूनिक्सोडबीसी चरित्र
- 25. क्वेरी सहायता - जहां खंड है और चरित्र
- 26. FragmentStatePagerAdapter खंडों को हटा नहीं रहा है यदि पैरेंट खंड हटा दिया गया है
- 27. अजगर और चरित्र सामान्य
- 28. बिट एक चरित्र को लपेटकर स्थानांतरित कर रहा है? सी ++
- 29. ';' इनपुट में चरित्र का गलत व्याख्या किया जा रहा है
- 30. ओह मेरे zsh अजीब चरित्र '?' दिखा रहा है टर्मिनल
कृपया अपना कुछ कोड और अपना आउटपुट और अपेक्षित आउटपुट जोड़ें। बेहतर समाधान तैयार करना अच्छा होगा –
नोट: यू + 2018 = बाएं सिंगल कोटेशन मार्क, यू + 201 9 = दायां सिंगल कोटेशन मार्क –