मैं एक प्रोग्राम लिख रहा हूं जो पर्ल में दस्तावेज़ों के साथ काम करता है और कई दस्तावेजों में ä, ö, ü, é, etc
(पूंजी और लोअरकेस दोनों) जैसे वर्ण हैं। मैं उन्हें एएससीआईआई समकक्ष a, o, u, e, etc
के साथ बदलना चाहता हूं। मैं पर्ल में यह कैसे करूँगा?पर्ल में उनके एएससीआईआई समकक्षों को लहजे, उमोट्स इत्यादि के साथ अक्षरों को कैसे परिवर्तित करें?
समाधान मैं के बारे में सोचा में से एक कुंजी ऊमलायूट और उच्चारण पात्रों जा रहा है, और मूल्यों ASCII समकक्षों होने के साथ एक हैश के लिए है, लेकिन है कि मुझे है, जो मैं डॉन सभी ऊमलायूट और उच्चारण वर्णों की एक सूची करने की आवश्यकता है मेरे पास नहीं है, और यदि मैंने एक सूची बनाई है, तो मैं निश्चित रूप से कई लोगों को याद करूँगा क्योंकि मैं उन सभी संभावित पात्रों से अपरिचित हूं जिनमें उमोट्स, उच्चारण और अन्य विशिष्टताएं हो सकती हैं।
उच्चारण हटाने की कोशिश करना लगभग हमेशा गलत काम है। मुझे लगता है कि आप चाहते हैं: [पर्ल में डायक्रिटिक के साथ स्ट्रिंग कैसे मिलान करें?] (Http://stackoverflow.com/q/7429964) – daxim
यदि नहीं: [मैं पर्ल में ASCII के साथ यूनिकोड वर्णों को कैसे प्रतिस्थापित कर सकता हूं?] (Http: //stackoverflow.com/q/2309215) [मैं विस्तारित लैटिन वर्णों को उनके असंबद्ध ASCII समकक्षों में कैसे बदल सकता हूं?] (http://stackoverflow.com/q/450026) – daxim
मुझे लगता है कि टेक्स्ट :: यूनिडकोड का पहला अनुच्छेद मॉड्यूल विवरण संभावित उपयोग मामलों को पर्याप्त रूप से परिभाषित करता है।) यह केवल collation के बारे में नहीं है। – raina77ow