संभव डुप्लिकेट (जर्मन में विशेष वर्ण) उमलॉट साथ समस्या है:
Javascript RegExp + Word boundaries + unicode charactersRegex शब्द सीमा b
ECMA स्क्रिप्ट regex में (यहां संदर्भ के लिए परीक्षण किया: http://regexpal.com/) मैं शब्द सीमाओं के साथ झूठी सकारात्मक (\b
का उपयोग करके) और उमलॉट वर्ण। उदाहरण
regex के लिए \bPflanzen\b
"Pflanzenöl" से मेल नहीं करना चाहिए, लेकिन यह करता है। अगर मैं ö
को oe
में बदलता हूं तो सब कुछ काम करता है। रेगेक्स शब्दों का हिस्सा बनने के लिए उमलों पर विचार नहीं करता है हालांकि वे कई भाषाओं में हैं।
सबसे अच्छा कामकाज क्या है?
... और सबसे अच्छा कामकाज XRegExp का उपयोग करना है, [इस उत्तर] के रूप में (http://stackoverflow.com/a/10591266/20938) अनुशंसा करता है। –