2012-11-06 11 views
5

में दृश्यमान-समान वर्ण मैं यूनिकोड में एक विशिष्ट चरित्र के लिए दृश्यमान समान वर्ण ढूंढना चाहता हूं। मुझे पता है कि चरित्र के कैननिकल या संगतता अपघटन कैसे प्राप्त करें; लेकिन वे मुझे वह नहीं देते जो मैं चाहता हूं। मैं उन पात्रों को ढूंढना चाहता हूं जो दृष्टिहीन समान हैं (समान नहीं), और उनका एकमात्र अंतर उनके आकार हो सकता है।यूनिकोड

उदाहरण के लिए मैं चाहता हूं: (एस, एस), या (एस, एस) (जिनके कोड बिंदु अलग हैं)। मुझे नहीं चाहिए (ß, β), या (ई, é)।

कोई सुझाव? धन्यवाद।

+2

यूनिकोड वर्णों की उपस्थिति निर्दिष्ट नहीं करता है। यह एक फ़ॉन्ट मुद्दा है। (मानक _representative_ छवियों का उपयोग करता है, लेकिन वे मानक का हिस्सा नहीं हैं।) उदाहरण के लिए, क्या आप पूंजी I और अंक 1 और कम केस एल सभी एक साथ चाहते हैं? कुछ फोंट में वे समान हैं और अन्य फ़ॉन्ट्स में वे सभी विशिष्ट हैं। –

उत्तर

5

किसी विशेष चरित्र के लिए, आप यूनिकोड मानक में कोड चार्ट में एनोटेशन से शुरू कर सकते हैं। एनोटेशन अक्सर समानता या आकार की पहचान सहित विभिन्न कारणों से अन्य पात्रों को संदर्भित करता है। लेकिन टिप्पणियां सबकुछ को कवर करने के लिए नहीं हैं।

आप अपने चरित्र को http://shapecatcher.com/ पर भी आकर्षित कर सकते हैं और इसे पहचानने के लिए कह सकते हैं। आपको अक्सर दृश्यमान समान विकल्पों की एक लंबी सूची मिलती है।

जैसा कि @TedHopp उनकी टिप्पणी में लिखता है, दृश्य पहचान फ़ॉन्ट-निर्भर है। उदाहरण के लिए, "एस" और "एस" को आकार में समान नहीं होना चाहिए; अधिकांश फोंट में, वे नहीं हैं - मूल रूप समान है, लेकिन स्ट्रोक चौड़ाई भिन्नता, वक्रता, सेरिफ़ इत्यादि में विभिन्न अंतर हैं। हालांकि, कुछ पात्रों को उनमें से किसी भी फ़ॉन्ट में दृष्टि से समान होने की उम्मीद की जा सकती है, जैसे कि लैटिन राजधानी ए, यूनानी पूंजी अल्फा Α, और सिरिलिक राजधानी ए के रूप में।

आपने अध्ययन का उद्देश्य निर्दिष्ट नहीं किया है, लेकिन आप कुछ ऐसा कर रहे हैं जो यूनिकोड कंसोर्टियम द्वारा कुछ हद तक किया गया है। UTR #6, यूनिकोड सुरक्षा संबंधी है, जो भी संबंधित काम के लिए संदर्भ, सहित शामिल देखें UTS #9, यूनिकोड सुरक्षा तंत्र, जो confusables.txt होता है, एक विशेष संदर्भ के लिए, IDN (यानी के लिए भ्रम मानचित्रण सिफारिश की, लेकिन इसके बारे में हो सकता है अन्य उद्देश्यों के लिए भी रुचि)।