क्या यूटीएफ 8

में लैंग्वेज वर्णों में भाषा विशिष्ट वर्णों को परिवर्तित करना संभव है? क्या मुझे आश्चर्य है कि क्या कोई रिश्ते या मौजूदा एल्गोरिदम यूटीएफ 8 कोडपेज के भीतर राष्ट्रीय अक्षरों से समकक्ष लैटिन वर्णों में परिवर्तित होने की इजाजत दे रहे हैं?क्या यूटीएफ 8

उदाहरण (पोलिश में) के लिए:

एक -> एक

Ó -> हे

Z -> z

Z -> z ...

वाक्यांश जैसे: 'zażółć gęślą jażń'

परिवर्तित : 'zazolc gesla jazn'

वर्तमान में मैं पोलिश के लिए एक रूपांतरण सरणी का उपयोग कर रहा हूं, लेकिन मैं सभी लैटिन आधारित भाषाओं को संभालने के लिए एक सार्वभौमिक समाधान की तलाश में हूं।

धन्यवाद

स्रोत

2011-06-14 tomekole

अपडेट: मुझे इसे .NET एप्लिकेशन में करने और स्ट्रिंग चर के साथ काम करने की आवश्यकता है। यह एक तरह से रूपांतरण है इसलिए पूलि के सुझाव के अनुसार कोई अतिरिक्त जानकारी स्टोर करने की आवश्यकता नहीं है। धन्यवाद। – tomekole

पहले जांच करें कि क्या आपको वास्तव में उच्चारण को पट्टी करने की आवश्यकता है। कोई वास्तविक 'बराबर' लैटिन चरित्र नहीं है, आप हमेशा इस तरह से जानकारी खो देते हैं। लेकिन यदि आप करते हैं, तो आइकनवे लाइब्रेरी या यूनिकोड अपघटन जैसी चीजें जैसे कुछ तरीके हैं। – schlenk

धन्यवाद schlenk। यूनिकोड अपघटन बिल्कुल वही लगता है जो मुझे चाहिए। – tomekole

चेक करें:

http://sourceforge.net/projects/iconvnet/

सामान्य तौर पर, कुछ के लिए खोज iconv

स्रोत

2011-06-14 10:42:25

, नहीं पूरी तरह से यकीन है कि यह एक निश्चित जवाब है कि आप की आवश्यकता होगी लेकिन जब मैं कहा जाता है इसे अतीत में करना था, मैंने सभी 'विशेष' वर्णों को नामित या संख्यात्मक इकाई में परिवर्तित कर दिया है ताकि वे रूपांतरण प्रक्रिया के दौरान सुरक्षित हो जाएं।

स्रोत

2011-06-14 10:45:06 Pooli

उत्तर को पूरा करने के लिए, 'यूनिकोड अपघटन + सी #' ने मुझे इस कोडप्रोजेक्ट आलेख (codeproject.com/KB/cs/UnicodeNormalization.aspx?display=Print) का नेतृत्व किया जो समाधान का उपयोग करने के लिए तैयार है। जो भी आप खोज रहे हैं उसे नाम देने की क्षमता को कम करके आंका नहीं जा सकता है;) सभी उत्तरों के लिए धन्यवाद।

स्रोत

2011-06-15 10:01:26 tomekole

क्या यूटीएफ 8

उत्तर

संबंधित मुद्दे