मैं एक स्ट्रिंग है s = 'Chocolate Moelleux-M\xe8re'
कहना जब मैं कर रहा हूँ:पायथन में एक गैर यूनिकोड चरित्र को डीकोड कैसे करें?
In [14]: unicode(s)
---------------------------------------------------------------------------
UnicodeDecodeError Traceback (most recent call last)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe8 in position 20: ordinal not in range(128)
इसी तरह जब मैं s.decode()
का उपयोग कर यह एक ही त्रुटि देता है द्वारा इस डिकोड करने के लिए कोशिश कर रहा हूँ।
In [13]: s.decode()
---------------------------------------------------------------------------
UnicodeDecodeError Traceback (most recent call last)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe8 in position 20: ordinal not in range(128)
ऐसी स्ट्रिंग को यूनिकोड में कैसे डीकोड करें।
यह मुझे सब स्थिति में मदद करने के लिए जा रहा है? क्या कोई सामान्यीकृत समाधान है? – user12345
क्या हम मूल स्ट्रिंग से, मेरे उदाहरण में 'x' जैसे उन वर्णों को हटा सकते हैं। – user12345
@alis: आप एन्कोडिंग अनुमान लगाने के लिए chardet (http://chardet.feedparser.org/) का उपयोग कर सकते हैं। – johnbaum