2010-06-09 13 views
7

मैं यूरोपीय क्लाइंट के लिए विकास और अनुप्रयोग से निपट रहा हूं और उनके मूल चरित्र सेट हैं।रेगेक्स - विदेशी पात्रों से मेल खाने के लिए रेगेक्स क्या होगा?

अब मुझे रेगेक्स होना चाहिए जो eéèêë आदि जैसे विदेशी पात्रों को अनुमति देगा और मुझे यकीन नहीं है कि यह कैसे किया जा सकता है।

कोई सुझाव?

उत्तर

10

यदि आप मिलान करना चाहते हैं तो पत्र ("अंतरराष्ट्रीय" अक्षरों सहित) आप \p{L} का उपयोग कर सकते हैं।

आप कुछ information on regex and Unicode here पा सकते हैं।

+0

में से किसी एक यह \ p {एल} की तरह '/^[a-zA-Z] + $/किया जाना चाहिए' coz यह इस तरह से काम नहीं कर रहा से मेल खाएगी। – Rachel

+0

@ राहेल: आपको शायद केवल \ \ {{}} से अधिक की आवश्यकता होगी क्योंकि यह * केवल * अक्षरों से मेल खाएगा (उदाहरण के लिए रिक्त स्थान या अन्य विभाजक या संख्या नहीं)। वास्तव में यह कैसे दिखाना चाहिए कि पूर्ण आवश्यकताओं को जानने के बिना आपको यह देखना असंभव है कि आपको पूरा करने की आवश्यकता है। –

0

आपके द्वारा उपयोग की जाने वाली रेनिक्स लाइब्रेरी/प्रोग्रामिंग भाषा पर निर्भर करता है।

+0

php यहां भाषा है। – Rachel

0

[e\xE8\xE9\xEA\xEB]eéèêë

+0

आप किस चरित्र एन्कोडिंग का जिक्र कर रहे हैं? – Gumbo

+0

विस्तारित ASCII। अच्छी पकड़। ASCII/ANSI के लिए एन्कोड किया जाना चाहिए (http://www.regular-expressions.info/reference.html के अनुसार।) (हालांकि ऐसा लगता है कि '\ p {L}' अभी भी एक बेहतर विकल्प है।) – dlras2

+0

विस्तारित ASCII है एक चरित्र सेट नहीं है जिसे मैं जानता हूं। यह कम से कम विंडोज -1252 (ईडब्ल्यू) और आईएसओ -885 9 -1 के साथ मेल खाता है। – Thanatos

संबंधित मुद्दे