2016-04-03 8 views
5

यूनिकोड को कब दाएं से बाएं या बाएं से दाएं पढ़ने के लिए पता चलता है।यूनिकोड में अरबी अक्षरों को संभालना

शब्द और पायथन दोनों में।

उदाहरण के लिए,

هذا هو الملعون جيد رجل الصباح! 

आप बैकस्पेस हिट करने के लिए थे, तो यह दाईं से बाईं ओर पढ़ कर दिया जाएगा।

मैं यूनिकोड बाइट्स प्रतिनिधित्व जो है

u'\u0647\u0630\u0627 \u0647\u0648 \u0627\u0644\u0645\u0644\u0639\u0648\u0646 \u062c\u064a\u062f \u0631\u062c\u0644 \u0627\u0644\u0635\u0628\u0627\u062d!' 

मुद्रित लेकिन मैं नहीं देखा कुछ भी दाएं या बाएं के लिए बाएं वाचक।

की तरह सामान्य तार के लिए,

Hi how are you, it works from left to right. 

वहाँ एक यूनिकोड चरित्र या बाइट नहीं होना चाहिए सही या कुछ और के लिए छोड़ दिया सूचित करने के लिए?

उत्तर

1

यहां बताया गया है कि इसे समझाने का एक हास्य तरीका है। https://www.explainxkcd.com/wiki/index.php/1137:_RTL

यूनिकोड में, RLM चरित्र U + 200F दाएँ-से-वाम मार्क (HTML ‏ · ‏). पर एन्कोड किया गया है UTF-8 में यह E2 80 8F है। यूनिकोड बिडरेक्शनल एल्गोरिदम में उपयोग निर्धारित किया गया है। LRM U + 200E बाएँ-से-दाएँ मार्क

https://en.wikipedia.org/wiki/Right-to-left_mark

द्विदिश एल्गोरिथ्म यहाँ वर्णित है एन्कोड किया गया है। http://unicode.org/reports/tr9/

विशेष रूप एएलएम U + 061C ARABIC पत्र मार्क राइट-से-बाएँ शून्य चौड़ाई अरबी चरित्र

+3

ध्यान दें कि अधिकांश समय * आपको * स्पष्ट दिशा नियंत्रण का उपयोग नहीं करना चाहिए। – o11c

2

लेखन दिशा प्रत्येक यूनिकोड वर्ण की संपत्ति है। यूनिकोड में प्रत्येक कोड बिंदु के लिए गुणों का एक जटिल सेट होता है (चाहे वह एक संख्या है, गणितीय प्रतीक, चाहे वह वर्णमाला है, इसका मामला, दिशात्मकता, कौन सा कोड ब्लॉक है - जो परोक्ष रूप से स्क्रिप्ट को परिभाषित करता है - आदि)।

उदाहरण के लिए, http://www.fileformat.info/info/unicode/char/0647/index.htm देखने (यह आपके उदाहरण में पहले वर्ण है), जो बीड़ी (bidirectionality) संपत्ति [AL] शामिल हैं - इस encodes "सही-से-बाएँ अरबी" इस ग्लिफ़ के लिए लेखन दिशा के रूप में।

यूनिकोड वर्ण हैं जो स्पष्ट रूप से पाठ की दिशा निर्धारित करते हैं, लेकिन इन्हें सामान्य रूप से आवश्यक या उपयोगी नहीं होना चाहिए। फ़ॉन्ट रेंडरर को पहले से ही पता होना चाहिए, प्रत्येक यूनिकोड गुणों से, प्रत्येक वर्ण के लिए, जिस दिशा में इसकी आवश्यकता होती है (हालांकि अन्य विरासत एन्कोडिंग से परिवर्तित टेक्स्ट में अभी भी स्पष्ट दिशा संकेतक कोड हो सकते हैं)।

संबंधित मुद्दे

 संबंधित मुद्दे