हमारे पास ऐसे अनुप्रयोगों का एक सेट है जो ASCII चरित्र सेट के लिए विकसित किए गए थे। अब, हम इसे आइसलैंड में स्थापित करने की कोशिश कर रहे हैं, और उन समस्याओं में भाग रहे हैं जहां आइसलैंडिक पात्र खराब हो रहे हैं।आप यूटीएफ -8 के लिए सुरक्षित कोड कैसे लिखते हैं?
हम अपने मुद्दों के माध्यम से काम कर रहे हैं, लेकिन मैं सोच रहा था: क्या सी ++ कोड लिखने के लिए वहां एक अच्छी "गाइड" है जो 8-बिट अक्षरों के लिए डिज़ाइन की गई है और यूटीएफ -8 डेटा को सही तरीके से काम करेगा यह?
मैं सभी को पूरे यूनिकोड मानक को पढ़ने की उम्मीद नहीं कर सकता, लेकिन अगर कुछ और पचाने योग्य उपलब्ध है, तो मैं इसे टीम के साथ साझा करना चाहता हूं ताकि हम इन मुद्दों में फिर से भाग न सकें।
wchar_t या किसी अन्य स्ट्रिंग प्रस्तुति का उपयोग करने के लिए सभी अनुप्रयोगों को दोबारा लिखना इस समय संभव नहीं है। मैं यह भी ध्यान दूंगा कि ये एप्लिकेशन उन सर्वरों और उपकरणों के साथ नेटवर्क पर संचार करते हैं जो 8-बिट वर्णों का उपयोग करते हैं, इसलिए यदि हमने आंतरिक रूप से यूनिकोड किया है, तो भी हमें सीमाओं पर अनुवाद के साथ समस्याएं होंगी। अधिकांश भाग के लिए, ये एप्लिकेशन बस डेटा पास करते हैं; वे टेक्स्ट को स्थान से कॉपी करने के अलावा किसी अन्य तरीके से पाठ को "संसाधित नहीं करते"।
विंडोज ऑपरेटिंग सिस्टम विंडोज और लिनक्स हैं। हम std :: स्ट्रिंग और सादे-पुराने सी तारों का उपयोग करते हैं। (और मुझे डिजाइन फैसले से किसी की रक्षा के लिए पूछना नहीं है मैं सिर्फ गंदगी ठीक करने के लिए कोशिश कर रहा हूँ।।)
यहाँ क्या सुझाव दिया गया है की एक सूची है:
- The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)
- UTF-8 and Unicode FAQ for Unix/Linux
- The Unicode HOWTO
क्या आप हमारे ऐप के ओएस की पुष्टि कर सकते हैं? क्या आप विंडोज के लिए प्रोग्रामिंग कर रहे हैं? क्या आप बड़े पैमाने पर std :: स्ट्रिंग या अधिक निचले स्तर सी हेडर का उपयोग कर रहे हैं? –
paercebal
यदि आपको कोई जवाब पसंद है, तो कृपया इसे ऊपर उठाएं - डांटने का कोई कारण नहीं है। –
केवल 30 मिनट, और आप पहले ही एक प्रतिनिधि को बढ़ावा देने की मांग कर रहे हैं? :) –