यह वास्तव में सबसे अच्छा है एक सामान्य रणनीति के रूप में, हमेशा यूनिकोड के रूप में अपने पाठ रखने के लिए एक बार यह स्मृति में है: इस समय यह इनपुट है पर यह डिकोड, और इस समय वास्तव में यह सांकेतिक शब्दों में बदलना आप उत्पादन यह, अगर करने की जरूरत है इनपुट और/या इनपुट समय पर विशिष्ट एन्कोडिंग आवश्यकताएं हैं।
भले ही आप इस सामान्य रणनीति को अपनाने का विकल्प नहीं चुनते हैं (और आपको चाहिए!), आपके द्वारा आवश्यक कार्य को करने का एकमात्र ध्वनि तरीका अभी भी डीकोड, प्रक्रिया, एन्कोड करना है - एन्कोडेड पर कभी काम नहीं करना रूपों। यानी .:
mystring = "işğüı"
print mystring.decode('utf-8').upper().encode('utf-8')
आप काम पर और उत्पादन उद्देश्यों के लिए एन्कोडेड तार करने के लिए विवश कर रहे हैं यह मानते हुए कि। (आउटपुट बाधा दुर्भाग्य से यथार्थवादी है, असाइनमेंट बाधा नहीं है - बस mystring = u"işğüı"
करें, इसे शुरुआत से यूनिकोड बनाएं, और कम से कम .decode
कॉल को सहेजें! -)
स्रोत
2010-02-23 01:05:43
इस उत्तर द्वारा उत्पादित आउटपुट (IŞĞÜI, यू +0049 लैटिन कैपिटल लिटर I से शुरू) प्रश्न द्वारा प्रदान किए गए सही आउटपुट से अलग है (İŞĞÜI, यू + 0130 लैटिन कैपिटल लेटर I के साथ डीओटी के साथ शुरू)। – thomasd