मैं वर्तमान में Digital Mars D भाषा के विनिर्देश की खोज कर रहा हूं, और मुझे आदिम चरित्र प्रकारों की पूरी प्रकृति को समझने में थोड़ी परेशानी हो रही है। Learn to Tango With D पुस्तक इस क्षेत्र में भाषा की क्षमताओं और सीमाओं पर समान अस्पष्ट है।डी में आदिम चरित्र प्रकार की सीमाएं क्या हैं?
प्रकार के रूप में the website पर दिए गए हैं:
char; // unsinged 8 bit UTF-8 wchar; // unsigned 16 bit UTF-16 dchar; // unsigned 32 bit UTF-32
के बाद से हम जानते हैं कि यूनिकोड परिवर्तन के सबसे (UTF) स्वरूप एनकोडिंग एक चर बिट-चौड़ाई के साथ केरेक्टर को अभिव्यक्त, इसका मतलब यह है कि डी में एक चार केवल उन मानों को शामिल किया जा सकता है जो 8 बिट्स में फिट होंगे, या जब आप इसे डबल बाइट वर्ण देते हैं तो यह मशीन की भौतिक स्मृति में विस्तारित होता है? शायद कुछ अन्य संभावनाएं हैं, जैसे कि अगली सबसे उचित प्रकार में स्वत: कास्टिंग जैसे आप चर को ओवरलोड करते हैं?
उदाहरण के लिए, मैं एक संपादक में यूटीएफ -8 char का उपयोग करना चाहता हूं और चीनी में टाइप करना चाहता हूं। क्या यह बस खत्म हो जाएगा, या क्या यह यूनिकोड वर्णों से अधिक 'सही', जैसे सी # में सौदा करने में सक्षम है? यूनिकोड द्वारा समर्थित किसी भी भाषा के साथ काम करने की अनुमति देने के लिए अभी भी गोंद कोड प्रदान करना आवश्यक होगा?
मैं किसी भी विशिष्ट जानकारी की सराहना करता हूं जो आप इस प्रकार के कवर के तहत काम करते हैं, और उनकी सीमाओं से निपटने के लिए किसी भी सामान्य सर्वोत्तम अभ्यास सलाह के बारे में बता सकते हैं।
रखें "जब से हम जानते हैं कि यूनिकोड मानक एक चर बिट-चौड़ाई के साथ पात्रों का प्रतिनिधित्व करता है "-> क्या आप utf8 का मतलब है? – elcuco
हां, मेरा मतलब यूएफटी एन्कोडिंग है। गलतफहमी के लिए खेद है। – IanGilham