मैं Django tutorial में इस मार्ग से अधिक ठोकर खाई:पाइथन/Django में यूनिकोड बनाम यूटीएफ -8 भ्रम?
Django मॉडल एक डिफ़ॉल्ट str() विधि कि यूनिकोड() कॉल करता है और एक UTF-8 bytestring लिए परिणाम धर्मान्तरित है। इसका मतलब है कि यूनिकोड (पी) यूनिकोड स्ट्रिंग लौटाएगा, और स्ट्र (पी) यूटीएफ -8 के रूप में एन्कोड किए गए अक्षरों के साथ एक सामान्य स्ट्रिंग लौटाएगा।
अब, मैं उलझन में हूं क्योंकि afaik यूनिकोड कोई विशेष प्रतिनिधित्व नहीं है, तो पाइथन में "यूनिकोड स्ट्रिंग" क्या है? क्या इसका मतलब यूसीएस -2 है? Googling this "Python Unicode Tutorial" बदल गया जो साहसपूर्वक
यूनिकोड दो-बाइट एन्कोडिंग है जो दुनिया की सभी सामान्य लेखन प्रणालियों को शामिल करता है।
जो सादा गलत है, या यह क्या है? मैं चरित्र सेट और एन्कोडिंग मुद्दों से कई बार उलझन में हूं, लेकिन यहां मुझे पूरा यकीन है कि जो दस्तावेज मैं पढ़ रहा हूं वह उलझन में है। क्या किसी को पता है कि पाइथन में क्या चल रहा है जब यह मुझे "यूनिकोड स्ट्रिंग" देता है?
UTF-16 के रूप में
कृपया, लोग, इस जवाब को वोट दें, भले ही अन्य चुने गए "उत्तर" को चुना गया हो। – tzot
[शग] दोनों सही हैं; यह 'लेन (' ΤΖΩΤΖΙΟΥ ') == 8' का प्रभाव है जो वास्तव में परिभाषित करता है कि यूनिकोड स्ट्रिंग * क्या है, मुझे लगता है। – bobince
मैं असहमत हूं; मैंने सवाल पढ़ा, और यह कहता है "पायथन में यूनिकोड स्ट्रिंग क्या है"। चुना गया उत्तर यादृच्छिक वाक्यों के जाल की तरह लगता है, जबकि आपका उत्तर बिंदु पर बहुत अधिक लगता है; हालांकि, यह एक मुद्दा है जिसे मैं आगे नहीं बढ़ाऊंगा। चीयर्स :) – tzot