के लिए आवश्यक बाइट्स की संख्या प्राप्त करें मेरे पास यूनिकोड के रूप में एन्कोडेड कोरियाई स्ट्रिंग है जैसे u'정정'
। मुझे कैसे पता चलेगा कि इस स्ट्रिंग का प्रतिनिधित्व करने के लिए कितने बाइट्स की आवश्यकता है?यूनिकोड स्ट्रिंग
मुझे सटीक बाइट गिनती जानने की आवश्यकता है क्योंकि मैं आईओएस पुश अधिसूचना के लिए स्ट्रिंग का उपयोग कर रहा हूं और इसकी पेलोड के आकार पर एक सीमा है।
len('정정')
काम नहीं करता है क्योंकि यह बाइट्स की संख्या नहीं, वर्णों की संख्या देता है।
आप कैसे जानते थे कि यह char '\ uC815' है? यह क्या एन्कोडिंग है? मैंने utf-8/16/32 का प्रयास किया और उनमें से कोई भी सही नहीं है, लेकिन '\ uC815' काम कर रहा है। – jasondinh
मेरे पास यूनिकोड चेकर नामक एक एप्लिकेशन है जिसे मैं संदर्भ के लिए उपयोग करता हूं, लेकिन 'C815' यूनिकोड कोड बिंदु है। यदि आप यूटीएफ -8 या यूटीएफ -16 बाइट अनुक्रम जानते हैं, तो आप यूनिकोड वर्ण (''xx \ xA0 \ x95'.decode (' UTF-8 ')') प्राप्त करने के लिए * से * डीकोड कर सकते हैं। पाइथन प्रॉम्प्ट यहां सहायक है; उदाहरण के लिए, पाइथन टर्मिनल पर यूनिकोड मानों को प्रतिबिंबित (प्रिंट नहीं) करते समय इसके 'यूनिकोड_स्केप' एन्कोडिंग का उपयोग करेगा। –
यूटीएफ -16 एन्कोडिंग की लंबाई का तात्पर्य है कि यूटीएफ -16 बीओएम शामिल किया जा रहा है। मुझे नहीं पता कि पाइथन इससे बचने के लिए 'एन्कोड ('यूटीएफ -16 बीई') जैसे कुछ का समर्थन करता है या नहीं। – bames53