2011-06-14 17 views
8

में लैंग्वेज वर्णों में भाषा विशिष्ट वर्णों को परिवर्तित करना संभव है? क्या मुझे आश्चर्य है कि क्या कोई रिश्ते या मौजूदा एल्गोरिदम यूटीएफ 8 कोडपेज के भीतर राष्ट्रीय अक्षरों से समकक्ष लैटिन वर्णों में परिवर्तित होने की इजाजत दे रहे हैं?क्या यूटीएफ 8

उदाहरण (पोलिश में) के लिए:

एक -> एक

Ó -> हे

Z -> z

Z -> z ...

वाक्यांश जैसे: 'zażółć gęślą jażń'

परिवर्तित : 'zazolc gesla jazn'

वर्तमान में मैं पोलिश के लिए एक रूपांतरण सरणी का उपयोग कर रहा हूं, लेकिन मैं सभी लैटिन आधारित भाषाओं को संभालने के लिए एक सार्वभौमिक समाधान की तलाश में हूं।

धन्यवाद

+0

अपडेट: मुझे इसे .NET एप्लिकेशन में करने और स्ट्रिंग चर के साथ काम करने की आवश्यकता है। यह एक तरह से रूपांतरण है इसलिए पूलि के सुझाव के अनुसार कोई अतिरिक्त जानकारी स्टोर करने की आवश्यकता नहीं है। धन्यवाद। – tomekole

+2

पहले जांच करें कि क्या आपको वास्तव में उच्चारण को पट्टी करने की आवश्यकता है। कोई वास्तविक 'बराबर' लैटिन चरित्र नहीं है, आप हमेशा इस तरह से जानकारी खो देते हैं। लेकिन यदि आप करते हैं, तो आइकनवे लाइब्रेरी या यूनिकोड अपघटन जैसी चीजें जैसे कुछ तरीके हैं। – schlenk

+0

धन्यवाद schlenk। यूनिकोड अपघटन बिल्कुल वही लगता है जो मुझे चाहिए। – tomekole

उत्तर

0

, नहीं पूरी तरह से यकीन है कि यह एक निश्चित जवाब है कि आप की आवश्यकता होगी लेकिन जब मैं कहा जाता है इसे अतीत में करना था, मैंने सभी 'विशेष' वर्णों को नामित या संख्यात्मक इकाई में परिवर्तित कर दिया है ताकि वे रूपांतरण प्रक्रिया के दौरान सुरक्षित हो जाएं।

1

उत्तर को पूरा करने के लिए, 'यूनिकोड अपघटन + सी #' ने मुझे इस कोडप्रोजेक्ट आलेख (codeproject.com/KB/cs/UnicodeNormalization.aspx?display=Print) का नेतृत्व किया जो समाधान का उपयोग करने के लिए तैयार है। जो भी आप खोज रहे हैं उसे नाम देने की क्षमता को कम करके आंका नहीं जा सकता है;) सभी उत्तरों के लिए धन्यवाद।

संबंधित मुद्दे