मुझे यह question मिला जो मुझे यह जांचने की क्षमता देता है कि स्ट्रिंग में चीनी वर्ण है या नहीं। मुझे यकीन नहीं है कि यूनिकोड रेंज सही हैं, लेकिन वे जापानी और कोरियाई के लिए झूठी वापसी करते हैं और चीनी के लिए सच हैं।पता लगाएं कि क्या चरित्र सरलीकृत है या पारंपरिक चीनी वर्ण
यह क्या नहीं करता है यह बताता है कि चरित्र पारंपरिक या सरलीकृत चीनी है या नहीं। आप इसे खोजने के बारे में कैसे जाएंगे?
अद्यतन
प्रश्न: मुझे एक यूनिकोड वर्ण अगर यह एक चीनी, कोरियाई या जापानी चरित्र है की 32 बिट मूल्य से कैसे पहचान सकते हैं?
http://unicode.org/faq/han_cjk.html
उनका तर्क है कि भले ही उनके आकार के पात्रों में एक ही अर्थ है और इसलिए एक ही कोड के प्रतिनिधित्व वाले किया जाना चाहिए। ठीक है, यह मेरे लिए अर्थहीन नहीं है क्योंकि मैं अलग-अलग पात्रों जो उनके समाधान के साथ काम नहीं करता है का विश्लेषण करने हूँ:
एक बेहतर समाधान एक पूरे के रूप पाठ को देखने के लिए है: काना की पर्याप्त मात्रा में आता है, यह है शायद जापानी, और यदि हंगुल की उचित मात्रा है, तो शायद यह कोरियाई है।
कोडपेज मदद करने में मदद करेगा? लगता है कि सरलीकृत चीनी सीपी 9 36 है और परंपरागत सीपी 950 है, कम से कम माइक्रोसॉफ्ट दुनिया में। शायद एमएस और आईबीएम कोडपेज के लिए http://www.i18nguy.com/unicode/codepages.html पर शुरू करें। – rajah9
मैंने एक त्वरित Google खोज की और पाया कि यह http://unicode.org/faq/han_cjk.html मुझे कुछ प्रश्न दिलचस्प हैं और वे वहां भी पारंपरिक पात्रों पर चर्चा करते हैं। आशा करता हूँ की ये काम करेगा! – Shaded
छायांकित लिंक किए गए अक्सर पूछे जाने वाले प्रश्न आपके प्रश्न का उत्तर देने लगते हैं। लिंक नोट्स में उदाहरण के रूप में, आप कैसे निर्धारित करेंगे कि "चैट" अंग्रेजी या फ्रेंच है या नहीं? यदि आपको नहीं लगता कि आपका उत्तर वहां है, तो आप शायद अपने प्रश्न का विस्तार करना चाहें। – Thanatos