UTF-8 यूनिकोड में से एक एन्कोडिंग है। यूटीएफ -16 और यूटीएफ -32 यूनिकोड के अन्य एन्कोडिंग हैं।
यूनिकोड हर किरदार के लिए एक अंकीय मान परिभाषित करता है; डिग्री प्रतीक 0xB0, या 176 दशमलव में होता है। यूनिकोड परिभाषित नहीं करता है कि उन संख्यात्मक मानों का प्रतिनिधित्व कैसे किया जाता है।
यूटीएफ -8 मूल्य 0xB0
मूल्य 0xC2 0xB0
के साथ लगातार दो ऑक्टेट्स (बाइट्स) के रूप में एन्कोड करता है।
यूटीएफ -16 समानता के आधार पर 0x00 0xB0
या 0xBo 0x00
के समान मूल्य को एन्कोड करता है।
यूटीएफ -32 इसे 0x00 0x00 0x00 0xB0
या 0xB0 0x00 0x00 0x00
के रूप में एन्कोड करता है, फिर अंतहीनता के आधार पर (मुझे लगता है कि अन्य ऑर्डर संभव हैं)।
स्रोत
2012-01-04 19:21:55
हजारों पात्र हैं जिनका प्रतिनिधित्व यूटीएफ -8 और यूटीएफ -16 के बीच अलग है। आपको क्या विश्वास है कि डिग्री प्रतीक विशेष उपचार के हकदार है? –
आपको यूनिकोड और इसके विभिन्न एन्कोडिंग के बीच अंतर को समझने की आवश्यकता है। लोगों द्वारा पोस्ट किए गए लिंक पढ़ें। – tripleee
@ माइकनाकिस: मेरा मानना है कि * सभी * यूनिकोड कोड बिंदुओं में यूटीएफ -8 और यूटीएफ -16 में अलग-अलग प्रतिनिधित्व हैं। –