iso-8859-1 utf-8 का उचित सबसेट है?
चरित्र reportoire ISO-8859-1 (यूनिकोड के पहले 256 वर्णों) की UTF-8 (हर यूनिकोड वर्ण) की इस बात का एक उचित सबसेट है।
हालांकि, characters U+0080 to U+00FF एन्कोडेड दो एन्कोडिंग में अलग-अलग हैं।
- ISO-8859-1 इन पात्रों एक एकल बाइट
80
से FF
के प्रत्येक प्रदान करती है।
- यूटीएफ -8 दो-बाइट अनुक्रम
C2 80
से C3 BF
के समान वर्णों को एन्कोड करता है।
आईएसओ -885 9-एन के बारे में क्या?
ये 15 अलग-अलग एन्कोडिंग हैं जिनमें कुल 614 विशिष्ट वर्ण हैं। इनमें से कुछ वर्ण आईएसओ 885 9 के कई "भागों" में होते हैं, और कुछ नहीं करते हैं। आपको और अधिक विशिष्ट होना होगा।
मुझे लगता है कि आपका प्रश्न आईएसओ -885 9-2 टैग किया गया है। अक्षर हैं जो -2 में हैं कि में -1 नहीं कर रहे हैं:
Ă㥹ĆćČčĎďĐđĘęĚěĹ弾ŁłŃńŇňŐőŔŕŘřŚśŞşŠšŢţŤťŮůŰűŹźŻżŽžˇ˘˙˛˝
के बारे में windows-1252 क्या?
विंडोज़ -1252 बस को छोड़कर यह प्रिंट करने योग्य पात्रों के साथ 0x80-0x9F रेंज में शायद ही कभी इस्तेमाल नियंत्रण वर्ण की जगह है कि ISO-8859-1 जैसे है। अक्षर हैं जो windows-1252 में लेकिन ISO-8859-1 में नहीं हैं:
ŒœŠšŸŽžƒˆ˜–—‘’‚“”„†‡•…‰‹›€™
तो तुम iso-8859-1 की कि repetoire कह रहे हैं utf-8 की repetoire का एक उचित सबसेट है ? मेरा मानना है कि। मुझे इस बारे में निश्चित नहीं है कि यूटीएफ -8 का पुनरावृत्ति यूनिकोड के पुनर्निर्माण के बराबर है। मैंने सोचा कि यूटीएफ -16/यूटीएफ -32 का उद्देश्य क्रमशः अधिक/सभी यूनिकोड अक्षरों को एन्कोड करने में सक्षम होना था। –
आह .. मैंने इसे देखा। चूंकि यूटीएफ -8 कई बाइट्स के रूप में वर्णों का प्रतिनिधित्व कर सकता है, यह सभी यूनिकोड रिपेटोइयर को व्यक्त कर सकता है। यह अब समझ में आता है। –