2013-03-28 24 views
6

मेरे परीक्षण मुझे बताते हैं कि, यूनिकोड 6.2 के अनुसार, पूर्ण संगतता अपघटनों के सभी पात्रों में संपत्ति NFD_Quick_Check = Yes है।एक संगतता सामान्य रूप में पहले से ही इसी सामान्य सामान्य रूप में एक स्ट्रिंग है?

इससे मुझे विश्वास होता है कि एनएफकेडी (एक्स) का अर्थ है एनएफडी (एक्स), और एनएनएफकेसी (एक्स) का मतलब है एनएफसी (एक्स)।

क्या मेरे निष्कर्ष सही हैं? और स्थिरता के बारे में क्या? क्या इन प्रभावों को यूनिकोड मानक के भविष्य के संस्करणों के लिए पकड़ने की गारंटी है?

उत्तर

1

आपके निष्कर्ष सही हैं। यूनिकोड स्टैंडर्ड अनुलग्नक # 15 राज्यों की धारा Design Goals:

toNFKC(x) = toNFC(toNFKC(x)) 
toNFKD(x) = toNFD(toNFKD(x)) 

स्थिरता के संबंध में, यह यूनिकोड के अगले संस्करण के लिए सच है, तो सामान्यीकृत स्ट्रिंग किसी भी असाइन नहीं किए गए कोड अंक शामिल नहीं है का आयोजन करेगा।

+0

छह महीने बाद! बहुत बहुत धन्यवाद। अब कोई मुझे बता सकता है कि मुझे यह कैसे याद आया? ;) –

0

मैं पाया है here निम्नलिखित है कि राज्यों:

दूसरे शब्दों में, एनएफसी और NFKC की रचना चरण एक ही -only उनके अपघटन चरण अलग है, NFKC अनुकूलता decompositions को लागू करने के साथ कर रहे हैं।

तो फिर वहाँ भी है इस:

सामान्य के दो रूपों है कि समग्र पात्रों में बदलने के होते हैं: सामान्यीकरण फार्म सी और सामान्यीकरण प्रपत्र केसी। इनके बीच का अंतर इस बात पर निर्भर करता है कि परिणामी पाठ मूल असामान्य पाठ या मूल असामान्य पाठ के समतुल्य संगतता के समतुल्य कैननिकल होना है या नहीं। (एनएफकेसी और एनएफकेडी में, एक के लिए संरचना के लिए सी खड़े होने से भ्रम से बचने के लिए संगतता के लिए खड़े होने के लिए उपयोग किया जाता है।) दोनों प्रकार के सामान्यीकरण विभिन्न परिस्थितियों में उपयोगी हो सकते हैं।

पहले तीन आंकड़े में, NFKD प्रपत्र हमेशा NFD रूप रूप में ही है, और NFKC प्रपत्र तो सादगी के लिए उन स्तंभों छोड़े गए हैं, एनएफसी रूप के रूप में ही होता है।

यही वह पाठ है जिसे मैं आपके प्रश्न के कम से कम हिस्से पर कुछ प्रकाश डाल सकता हूं। आशा है कि यह मदद करता है

वहाँ भी Wikipedia article में इस तालिका है:

NFD सामान्यीकरण प्रपत्र विहित अपघटन: वर्ण विहित तुल्यता द्वारा विघटित कर रहे हैं, और कई के संयोजन वर्ण एक विशेष क्रम में व्यवस्थित कर रहे हैं।

एनएफसी सामान्यीकरण प्रपत्र विहित संरचना: वर्ण विघटित कर रहे हैं और उसके बाद विहित तुल्यता द्वारा recomposed।

NFKD सामान्यीकरण प्रपत्र संगतता अपघटन: वर्ण अनुकूलता द्वारा विघटित कर रहे हैं, और कई के संयोजन वर्ण एक विशेष क्रम में व्यवस्थित कर रहे हैं।

NFKC सामान्यीकरण प्रपत्र संगतता संरचना: वर्ण, संगतता द्वारा विघटित कर रहे हैं तो विहित तुल्यता द्वारा recomposed।

इन चीजों के बारे में स्पष्टीकरण को देखते हुए, मुझे नहीं लगता कि आप निष्कर्ष निकाल सकते हैं कि कोई दूसरा का तात्पर्य है।एनएफडी कैननिकल समकक्ष द्वारा विघटित होता है, जबकि एनएफकेडी संगतता से विघटित होता है। या तो विहित (NF) या संगतता (NFK)

तुल्यता मापदंड हो सकते हैं:

एक ही लेख में यह भी कहा गया।

मेरे लिए इसका मतलब यह है कि इसकी या तो वैचारिक या इसकी संगतता है। एनएफडी और एनएफकेडी अलग-अलग चीजें करते हैं।


इस implementation notes लेख में यह कहा गया है:

सभी संस्करणों के लिए, यहां तक ​​कि यूनिकोड 4.1 से पहले, निम्नलिखित नीति का पालन किया जाता है:

एक सामान्यीकृत स्ट्रिंग स्थिर होने की गारंटी है; एक बार सामान्यीकृत होने पर, यूनिकोड के सभी भावी संस्करणों के अनुसार एक स्ट्रिंग को सामान्यीकृत किया जाता है।

संबंधित मुद्दे