के साथ मेरे पास बाइट स्ट्रिंग्स (str
, unicode
नहीं है, पायथन 2.7) में यूनिकोड डेटा (utf-8
एन्कोडिंग में) है।पायथन 2.7 string.join() यूनिकोड
मैं उन्हें ("".join(utf8_strings)
या u"".join(utf8_strings)
द्वारा) में शामिल होने का जो फेंकता
UnicodeDecodeError: 'ascii' codec can't decode byte 0xec in position 0: ordinal not in range(128)`
वहाँ गैर- ASCII तार के लिए .join()
विधि का उपयोग करने के लिए किसी भी तरह है कोशिश कर रहा हूँ? यकीन है कि मैं उन्हें लूप में जोड़ सकता हूं, लेकिन यह लागत प्रभावी नहीं होगा।
तब कोई यूनिकोड' और 'str' ऑब्जेक्ट्स को अन-मिश्रण कैसे करेगा? – fiona
@fiona अपने बाइट तारों को यूनिकोड पर तय करें, फिर शामिल हों। जितनी जल्दी हो सके डीकोड करना सबसे अच्छा है, जब आप पाठ के साथ होते हैं तो केवल एन्कोड करें और इसे किसी ऐसे चीज़ पर पास करना होगा जो केवल बाइट स्वीकार करेगा। –