संभव डुप्लिकेट:
Python UnicodeDecodeError - Am I misunderstanding encode?पायथन: यूनिकोड के लिए एक स्ट्रिंग को स्वच्छ करें?
मैं एक स्ट्रिंग है कि मैं unicode()
समारोह के लिए सुरक्षित बनाने के लिए कोशिश कर रहा हूँ है:
>>> s = " foo “bar bar ” weasel"
>>> s.encode('utf-8', 'ignore')
Traceback (most recent call last):
File "<pyshell#8>", line 1, in <module>
s.encode('utf-8', 'ignore')
UnicodeDecodeError: 'ascii' codec can't decode byte 0x93 in position 5: ordinal not in range(128)
>>> unicode(s)
Traceback (most recent call last):
File "<pyshell#9>", line 1, in <module>
unicode(s)
UnicodeDecodeError: 'ascii' codec can't decode byte 0x93 in position 5: ordinal not in range(128)
मैं ज्यादातर चारों ओर घिसटते हुए कर रहा हूँ यहाँ। स्ट्रिंग से असुरक्षित वर्णों को हटाने के लिए मुझे क्या करने की ज़रूरत है?
कुछ हद तक इस question से संबंधित है, हालांकि मैं इसे से मेरी समस्या का समाधान करने में असमर्थ था।
यह भी विफल रहता है:
>>> s
' foo \x93bar bar \x94 weasel'
>>> s.decode('utf-8')
Traceback (most recent call last):
File "<pyshell#13>", line 1, in <module>
s.decode('utf-8')
File "C:\Python25\254\lib\encodings\utf_8.py", line 16, in decode
return codecs.utf_8_decode(input, errors, True)
UnicodeDecodeError: 'utf8' codec can't decode byte 0x93 in position 5: unexpected code byte
मुझे आश्चर्य है कि क्यों 'str' में' एन्कोड 'फ़ंक्शन है, और क्या "एन्कोडिंग" पैरामीटर परिणाम के एन्कोडिंग या इनपुट के एन्कोडिंग को निर्दिष्ट करता है। आप यहाँ क्या करने का प्रयास कर रहे हैं? – Thanatos
कृपया जांचें [यह] (http://stackoverflow.com/questions/368805/python-unicodedecodeerror-am-i-misunderstanding-encode/370199#370199) संबंधित प्रश्न का उत्तर दें: "पायथन यूनिकोडडेकोड एरर - क्या मैं एन्कोड गलत समझ रहा हूं? " – tzot
उन लोगों के लिए जो यूनिकोड विशेष वर्णों को (एक्स) एचटीएमएल में स्वच्छ करने के लिए एक समाधान शिकार करते हैं, 'आप' यूनिकोड str'.encode '' ascii ',' xmlcharrefreplace ')' 'प्रयास करें। – toszter