2012-04-05 22 views
5
  • iso-8859-1 utf-8 का उचित सबसेट है?
  • आईएसओ -885 9-एन के बारे में क्या?
  • विंडोज -1252 के बारे में क्या?

यदि उत्तर उपर्युक्त में से कोई भी नहीं है, तो अलग-अलग पात्र क्या हैं? मैं कुछ तर्कों का परीक्षण कर रहा हूं जो वर्णमाला का पता लगाते हैं और जांच को सत्यापित करने के लिए परीक्षण लिखना चाहते हैं, ठीक से काम कर रहा है।कैरेक्टर सेट विशेष वर्ण

उत्तर

8

iso-8859-1 utf-8 का उचित सबसेट है?

चरित्र reportoire ISO-8859-1 (यूनिकोड के पहले 256 वर्णों) की UTF-8 (हर यूनिकोड वर्ण) की इस बात का एक उचित सबसेट है।

हालांकि, characters U+0080 to U+00FF एन्कोडेड दो एन्कोडिंग में अलग-अलग हैं।

  • ISO-8859-1 इन पात्रों एक एकल बाइट80 से FF के प्रत्येक प्रदान करती है।
  • यूटीएफ -8 दो-बाइट अनुक्रम C2 80 से C3 BF के समान वर्णों को एन्कोड करता है।

आईएसओ -885 9-एन के बारे में क्या?

ये 15 अलग-अलग एन्कोडिंग हैं जिनमें कुल 614 विशिष्ट वर्ण हैं। इनमें से कुछ वर्ण आईएसओ 885 9 के कई "भागों" में होते हैं, और कुछ नहीं करते हैं। आपको और अधिक विशिष्ट होना होगा।

मुझे लगता है कि आपका प्रश्न आईएसओ -885 9-2 टैग किया गया है। अक्षर हैं जो -2 में हैं कि में -1 नहीं कर रहे हैं:

Ă㥹ĆćČčĎďĐđĘęĚěĹ弾ŁłŃńŇňŐőŔŕŘřŚśŞşŠšŢţŤťŮůŰűŹźŻżŽžˇ˘˙˛˝

के बारे में windows-1252 क्या?

विंडोज़ -1252 बस को छोड़कर यह प्रिंट करने योग्य पात्रों के साथ 0x80-0x9F रेंज में शायद ही कभी इस्तेमाल नियंत्रण वर्ण की जगह है कि ISO-8859-1 जैसे है। अक्षर हैं जो windows-1252 में लेकिन ISO-8859-1 में नहीं हैं:

ŒœŠšŸŽžƒˆ˜–—‘’‚“”„†‡•…‰‹›€™

+0

तो तुम iso-8859-1 की कि repetoire कह रहे हैं utf-8 की repetoire का एक उचित सबसेट है ? मेरा मानना ​​है कि। मुझे इस बारे में निश्चित नहीं है कि यूटीएफ -8 का पुनरावृत्ति यूनिकोड के पुनर्निर्माण के बराबर है। मैंने सोचा कि यूटीएफ -16/यूटीएफ -32 का उद्देश्य क्रमशः अधिक/सभी यूनिकोड अक्षरों को एन्कोड करने में सक्षम होना था। –

+1

आह .. मैंने इसे देखा। चूंकि यूटीएफ -8 कई बाइट्स के रूप में वर्णों का प्रतिनिधित्व कर सकता है, यह सभी यूनिकोड रिपेटोइयर को व्यक्त कर सकता है। यह अब समझ में आता है। –

0

यूनिकोड इन सभी चरित्र सेटों का एक सुपरसेट है, और वहां से बहुत सारे स्थापित चरित्र सेट हैं। आप इन सभी वर्ण सेटों के मैपिंग की सूची यहां यूनिकोड कोड पॉइंट्स पर देख सकते हैं: http://unicode.org/Public/MAPPINGS/

संबंधित मुद्दे