ऐसा लगता है कि यहअपरकेस यूनिकोड के लिए रेगेक्स "Ó" से मेल नहीं खाता है?
#!/usr/bin/env perl
use strict;
use warnings;
use 5.14.0;
use utf8;
use feature 'unicode_strings';
" SIMÓN " =~ /^\s+(\p{Upper}+)/u;
print "$1\n";
रिटर्न
SIM
अपरकेस के रूप में उच्चारण Ó को नहीं पहचानता है पर्ल यूनिकोड डेटा है, जो पहले से ही बड़े रूप में Ó टैग का उपयोग करने में सक्षम होना चाहिए। Emacs describe-char
character code properties: customize what to show
name: LATIN CAPITAL LETTER O WITH ACUTE
old-name: LATIN CAPITAL LETTER O ACUTE
general-category: Lu (Letter, Uppercase)
decomposition: (79 769) ('O' '́')
मुझे नहीं पता कि आप प्रदान किए गए _more_ न्यूनतम मामले को कैसे प्राप्त कर सकते हैं :-) – paxdiablo
आह, मेरी माफी, @pst। मैं केवल सामग्री की बजाय लाइन _count_ को देख रहा था। आप सही हैं कि आरई स्वयं को सरल बनाया जा सकता है। – paxdiablo