यह भी पीछे हटना करने के लिए सार्थक हो सकता है और पर विचार क्यों यदि आप ऐसा करना चाहते हो सकता है। यदि आप चरित्र अंतर को हटाने की कोशिश कर रहे हैं तो आप महत्वहीन मानते हैं, आपको यूनिकोड संयोजन एल्गोरिदम को देखना चाहिए। खोज या सॉर्टिंग के लिए स्ट्रिंग की तुलना करते समय केस या डाइक्रिटिक्स जैसे मतभेदों को नजरअंदाज करने का यह मानक तरीका है।
यदि आप संशोधित पाठ प्रदर्शित करने की योजना बना रहे हैं, तो अपने दर्शकों पर विचार करें। आप सुरक्षित रूप से फ़िल्टर कर सकते हैं लोकेल संवेदनशील है। यूएस अंग्रेजी में, "इग्लू" = "इग्लू", और "फिर से शुरू करें" = "रेज़्यूमे", लेकिन तुर्की में, एक कम मामला मैं ı (डॉटलेस) हूं, और फ्रेंच में, कोटे का मतलब उद्धरण है, कोटे का मतलब है पक्ष, और कोट माध्यम तट। तो, संयोजन भाषा निर्धारित करती है कि अंतर क्या महत्वपूर्ण हैं।
यदि आपके आवेदन के लिए डाइक्रिटिक्स को सही समाधान है, तो अपनी खुद की तालिका का उत्पादन करना सबसे सुरक्षित है जिसमें आप स्पष्ट रूप से उन पात्रों को जोड़ते हैं जिन्हें आप कनवर्ट करना चाहते हैं।
यूनिकोड अपघटन का उपयोग करके एक सामान्य, स्वचालित दृष्टिकोण तैयार किया जा सकता है। इसके साथ, आप अक्षरों के साथ वर्णों को "संयोजन" करने के लिए वर्णों (diacritic अंक) और आधार चरित्र के साथ विघटित कर सकते हैं जिसके साथ वे संयुक्त होते हैं। संयोजन संयोजन वाले किसी भी चीज को फ़िल्टर करें, और आपके पास "गैर-विशिष्ट" होना चाहिए।
स्वचालित विधि में भेदभाव की कमी, हालांकि, कुछ अप्रत्याशित प्रभाव हो सकते हैं। मैं पाठ के प्रतिनिधि निकाय पर बहुत से परीक्षण की सिफारिश करता हूं।
जब मुझे पेर्ल में ऐसा करना पड़ा तो मुझे बस एक बड़ा लंबा हाथ से बनाए रखा "tr" कथन था, तो शुभकामनाएं। –
यह _several_ प्रश्नों का एक डुप्लिकेट है। उदाहरण के लिए, "अनुवाद" की खोज करें। कृपया हमारी भाषाओं को कुचलने मत करो! – hop