#coding: utf-8
str2 = "asdfМикимаус"
p str2.encoding #<Encoding:UTF-8>
p str2.scan /\p{Cyrillic}/ #found all cyrillic characters
str2.gsub!(/\w/u,'') #removes only latin characters
puts str2
सवाल यह है कि क्यों \w
सिरिलिक वर्ण उपेक्षा में यूनिकोड सिरिलिक वर्ण के लिए Regexp निर्दिष्ट करने के लिए?कैसे रूबी 1,9
मैंने http://rubyinstaller.org/ से नवीनतम रूबी पैकेज स्थापित किया है। यहाँ जहां तक मुझे पता है 1.9 oniguruma नियमित अभिव्यक्ति पुस्तकालय यूनिकोड वर्ण के लिए पूरा समर्थन है ruby -v
ruby 1.9.1p378 (2010-01-10 revision 26273) [i386-mingw32]
की मेरी उत्पादन होता है।
लिनक्स पर (रूबी 1.9) gsub सभी पात्रों को हटाएं - irb (मुख्य): 006: 0> str2.gsub (/ \ w/u, '') => " – andrykonchin
@aaz: इसे नहीं देखना चाहिए मेरा जवाब); शायद आपके पास पुराना संस्करण है? –
मैं इस सवाल का नाम बदलूंगा "रूबी 1.9 में यूनिकोड वर्णों के लिए रेगेक्सपी को कैसे निर्दिष्ट करें", क्योंकि यह Win32 से संबंधित नहीं है और न ही केवल (केवल) सिरिलिक से संबंधित है। –