देखो करने के लिए:पायथन यूनिकोड सामान्य: यह सही यू अनुवाद करने के लिए है ' xb4' यू ' u0301' निम्नलिखित स्निपेट में
>>> import unicodedata
>>> from unicodedata import normalize, name
>>> normalize('NFKD', u'\xb4')
u' \u0301'
>>> normalize('NFKD', u'a\xb4a')
u'a \u0301a'
>>> normalize('NFKC', u'a\xb4a')
u'a \u0301a'
>>> name(u'\xb4'), name(u'\u0301')
('ACUTE ACCENT', 'COMBINING ACUTE ACCENT')
मुझे यह समझाया गया है, तो व्यवहार u' \u0301'
है u'\xb4'
अनुवाद करने के लिए कोशिश कर रहा हूँ सही बात। यह एक अंतरिक्ष के साथ संयोजन तीव्र उच्चारण पैड क्यों करता है? यह आपको \xb4
का अनुवाद क्यों करता है?
fileformat पर हम देखते हैं कि ACUTE ACCENT
को SPACING ACUTE
कहा जाता था। मैंने सोचा, इसका मतलब यह था कि कर्सर को निम्नलिखित वर्णों को टाइप करने के लिए आगे बढ़ने की बजाय स्थानांतरित करना चाहिए।
यूपीडी: यदि कोई दिलचस्पी लेता है, तो यहां एक सूची है यदि यूनिकोड वर्ण हैं कि एनएफकेसी सामान्यीकरण के बाद एक जगह है शुरुआत: http://pastebin.com/Z99r5AK9
बहुत रोचक, धन्यवाद! – newtover
यू +00 बी 4 ACUTE ACCENT और यू + 02 सीए मोडिफ़ीटर लेटर एक्यूट अकाउंट अलग-अलग वर्ण हैं और उन्हें "इसे प्रस्तुत करने" की अपेक्षा नहीं की जानी चाहिए। पूर्व फोंट में अक्सर अधिक उपस्थित होता है। जब दोनों मौजूद होते हैं, तो वे आम तौर पर समान दिखते हैं, या वही होते हैं, लेकिन उनके पास यूनिकोड मानक (उदा। सामान्य श्रेणी प्रतीक, संशोधक बनाम पत्र, संशोधक) में परिभाषित विभिन्न गुण होते हैं। और, उदाहरण के लिए, डोलोस एसआईएल फ़ॉन्ट में, उनके ग्लिफ स्पष्ट रूप से समान हैं लेकिन अग्रिम चौड़ाई अलग हैं; और मिंगिलू में, ढलान बहुत अलग हैं। –
@ जुक्काका। कोर्पेला: मैं सही खड़ा हूं; मैंने संदर्भ को गलत समझा होगा, मैं उस भाग को हटा दूंगा। –