मैं इस चरित्र को अफ्रीकी योरूबा भाषा 'ẹ' में मिलान करना चाहता हूं। आमतौर पर यह 'é' को डॉट डायक्रिटिक के तहत '\ u0323' के संयोजन से बनाया जाता है। मैंने पाया कि:जावास्क्रिप्ट रेगेक्स + यूनिकोड डायक्रिटिक संयोजन अक्षरों
'é\u0323'.match(/[é]\u0323/) works but
'ẹ́'.match(/[é]\u0323/) does not work.
मैं सिर्फ ई से मेल नहीं करना चाहता हूं। मैं सभी संयोजनों से मेल खाना चाहता हूं। अभी, मेरे समाधान में सभी संयोजनों का आकलन शामिल है। इस प्रकार: /[ÁÀĀÉÈĒẸE̩Ẹ́É̩Ẹ̀È̩Ẹ̄Ē̩ÍÌĪÓÒŌỌO̩Ọ́Ó̩Ọ̀Ò̩Ọ̄Ō̩ÚÙŪṢS̩áàāéèēẹe̩ẹ́é̩ẹ̀è̩ẹ̄ē̩íìīóòōọo̩ọ́ó̩ọ̀ò̩ọ̄ō̩úùūṣs̩]/
क्या ऐसा करने के लिए एक छोटा और बेहतर तरीका नहीं हो सकता है, या यूनिकोड डायक्रिटिक संयोजनों के जावास्क्रिप्ट में रेगेक्स मिलान करना आसानी से काम नहीं करता है? धन्यवाद
यदि मुझे ईमानदार होना है, तो मैं डिक्रिप्ट की तुलना में वर्णों की छोटी स्ट्रिंग को पढ़ और बनाए रखूंगा और संभवतः अधिक चालाक रेगेक्स के \ uxxxx भाग को समझूंगा। एक लुकअप टेबल का उपयोग करना हमेशा पहले चार की गणना करने से तेज़ होगा। एक संभावित तरीका अगर रेगेक्स विफल रहता है तो आप एक अवधि में चार को प्रस्तुत करना है और फिर – mplungjan
की तुलना करना एक अच्छा बिंदु है। शायद वर्तमान तरीका बेहतर है। – user2530580
मैं \ uxxxx भाग के साथ जा रहा था क्योंकि इसे विम में संपादित करने से बहुत अधिक समझ में आया जब अलग-अलग प्रवाह दिशाओं के साथ अलग-अलग चौड़ाई यूनिकोड बिंदु नहीं थे, कर्सर की स्थिति के साथ काफी अद्भुत चीजें कर रही थीं: इसकी स्थिति मूल रूप से एक यादृच्छिक चर बन गई । – user2530580