2013-01-20 14 views
11

मानक एमएल यूनिकोड का समर्थन करता है?मानक एमएल यूनिकोड का समर्थन करता है?

मुझे विश्वास है कि ऐसा नहीं है लेकिन एसएमएल के लिए ऐसा कोई आधिकारिक दस्तावेज नहीं मिल रहा है।

एक हां या नहीं, जो आवश्यक है, लेकिन आपको एक तथ्य के बारे में पता होना चाहिए। कोई अनुमान नहीं है या मैं जवाब मानता हूं। एक आधिकारिक लिंक बेहतर होगा।

उत्तर

9

वास्तव में नहीं। \uXXXX का उपयोग करने की क्षमता मानक और स्ट्रिंग अक्षर में से बचने की क्षमता है, और यह कम से कम char या वैकल्पिक WideChar.char के लिए अंतर्निहित वर्ण एन्कोडिंग के रूप में यूनिकोड को अनुमति देता है। लेकिन मानक आधार पुस्तकालय अतिरिक्त यूनिकोड-जागरूक कार्यक्षमता के लिए कोई समर्थन निर्धारित नहीं करता है।

विशेष कार्यान्वयन में अतिरिक्त समर्थन हो सकता है, और शायद आपको कुछ तृतीय-पक्ष यूनिकोड पुस्तकालय मिल सकते हैं, लेकिन यह इसके बारे में है (दुर्भाग्य से, मेरे पास कोई संकेत नहीं है)।

+0

कम से कम [एमएलटन] (http://mlton.org/Unicode) वर्तमान में यूनिकोड का पूर्ण समर्थन नहीं करता है। हालांकि वे इस पर काम करने का दावा करते हैं, इसलिए अब और सर्वनाश के बीच कहीं भी, हम इसे एक नया संस्करण देख सकते हैं जो इसका समर्थन करता है :) –

3

यह "यूनिकोड" द्वारा आपके द्वारा किए गए बहुत से पर निर्भर करता है, जो कि कई चीजों के लिए कई मानकों का संग्रह है। मैंने यूनिकोड को पूरी तरह से समर्थन देने वाली कोई भी भाषा या प्रणाली नहीं देखी है, और मुझे यह भी नहीं पता कि सभी विवरणों में इसका क्या अर्थ होगा।

आप निश्चित रूप से एसएमएल में यूटीएफ -8 के साथ काम कर सकते हैं: एएससीआईआई अनुप्रयोगों के लिए यूनिकोड का समर्थन करने के लिए यह एन्कोडिंग का आविष्कार किया गया था। इसके परिणामस्वरूप यूनिकोड की तुलना में यह बेहतर और अधिक कुशल प्रतिनिधित्व हो सकता है। यूटीएफ -16 जावा में देखा गया है, जो आधिकारिक तौर पर "यूनिकोड का समर्थन करता है", लेकिन उसके साथ कई व्यावहारिक समस्याएं हैं (जैसे सरोगेट पात्र)।

एसएमएल तारों में यूटीएफ -8 के साथ, एक सवाल यह है कि स्ट्रिंग अक्षर के साथ कैसे काम करना है। पॉली/एमएल जैसे सिस्टम एमएल को type string के लिए सुंदर प्रिंटर को फिर से परिभाषित करने की अनुमति देते हैं, और यूनिकोड अनुकूल तरीके से स्ट्रिंग अक्षर को संसाधित करने के लिए कंपाइलर को लपेटना भी संभव है। यह दोनों इसाबेल/एमएल में किया जाता है, जो पॉली/एमएल पर आधारित है। तो यदि आप एमएल विकास मंच के रूप में उस बड़े प्रमेय सिद्ध पर्यावरण को लेते हैं, तो आपके पास कुछ प्रकार का यूनिकोड समर्थन बनाया गया है (तथाकथित "इसाबेल प्रतीकों" के माध्यम से)।

+0

यूटीएफ -8 एएससीआईआई * डेटा * के लिए यूटीएफ -8 प्रोग्राम के साथ काम करना आसान बनाता है, और एएससीआईआई अनुप्रयोगों के लिए यूटीएफ -8 डेटा द्वारा बहुत बुरी तरह टूटा नहीं जा सकता है। वास्तव में यूटीएफआई 8 के साथ ठीक से काम करने के लिए एएससीआईआई डेटा मानते हुए किसी भी एप्लिकेशन को बदलना आम तौर पर एक राक्षसी कार्य है, हालांकि, ऐसे अनुप्रयोग लगभग सार्वभौमिक रूप से एक निश्चित वर्ण चौड़ाई मानते हैं और यूटीएफ -8 में चर-चौड़ाई वाले वर्ण होते हैं। –

संबंधित मुद्दे