2012-07-09 10 views
8

मैं विंडोज सीई 6/7 चलाने वाले हमारे मोबाइल उपकरणों के लिए लुआ में एक grep उपयोगिता लिख ​​रहा हूं, लेकिन मैंने केस-असंवेदनशील मिलान पैटर्न को लागू करने वाले कुछ मुद्दों में भाग लिया है। सबकुछ को अपरकेस (या निचले) में परिवर्तित करने का स्पष्ट समाधान चरित्र वर्गों के कारण बस इतना काम नहीं करता है।केस-असंवेदनशील लुआ पैटर्न-मिलान

एकमात्र अन्य चीज जिसे मैं सोच सकता हूं वह पैटर्न में खुद को अपरकेस में परिवर्तित कर रहा है।

यहाँ मैं अब तक है:

function toUpperPattern(instr) 
    -- Check first character 
    if string.find(instr, "^%l") then 
     instr = string.upper(string.sub(instr, 1, 1)) .. string.sub(instr, 2) 
    end 
    -- Check the rest of the pattern 
    while 1 do 
     local a, b, str = string.find(instr, "[^%%](%l+)") 
     if not a then break end 
     if str then 
      instr = string.sub(instr, 1, a) .. string.upper(string.sub(instr, a+1, b)) .. string.sub(instr, b + 1) 
     end 
    end 
    return instr 
end 

मैं स्वीकार करने के लिए कितनी देर तक यह भी है कि अब तक प्राप्त करने के लिए ले लिया नफरत है, और मैं अभी भी तुरंत देख सकते हैं वहाँ से भाग निकले प्रतिशत जैसी चीजों के साथ समस्याओं होने जा रहे हैं संकेत '%%'

मुझे लगा कि यह एक सामान्य आम मुद्दा होना चाहिए, लेकिन मुझे इस विषय पर अधिक प्रतीत नहीं होता है। क्या ऐसा करने के लिए कोई आसान (या कम से कम पूर्ण) तरीके हैं? मैं यहाँ पागल हो रहा हूं ... आपको लुआ गुरुओं की उम्मीद है कि मुझे ज्ञान मिल सकता है! इस तरह

उत्तर

9

कोशिश कुछ:

function case_insensitive_pattern(pattern) 

    -- find an optional '%' (group 1) followed by any character (group 2) 
    local p = pattern:gsub("(%%?)(.)", function(percent, letter) 

    if percent ~= "" or not letter:match("%a") then 
     -- if the '%' matched, or `letter` is not a letter, return "as is" 
     return percent .. letter 
    else 
     -- else, return a case-insensitive character class of the matched letter 
     return string.format("[%s%s]", letter:lower(), letter:upper()) 
    end 

    end) 

    return p 
end 

print(case_insensitive_pattern("xyz = %d+ or %% end")) 

जो प्रिंट:

[xX][yY][zZ] = %d+ [oO][rR] %% [eE][nN][dD]
+1

बहुत बढ़िया। मैं एक खाली चित्रण कर रहा था। बीटीडब्ल्यू: आप 'पैटर्न: gsub' कह सकते हैं जैसा कि आपने कहा था' अक्षर: निचला'। आप यह भी कह सकते हैं '(' [% s% s] '): प्रारूप' लेकिन यह थोड़ा कमजोर है। – Mud

+0

हाँ, 'string.format (...)' '('[% s% s]' से अधिक परिचित दिखता है): प्रारूप (...) ', लेकिन मुझे' पैटर्न: gsub (...) पसंद है बेहतर धन्यवाद। –

+0

अविश्वसनीय। लेकिन एक सवाल ... यह '%% test' जैसे' %% [tT] est' में कुछ कैसे परिवर्तित नहीं करता है? क्या वह मैच छोड़ दिया गया है क्योंकि पिछले पुनरावृत्ति दोनों '%%' से मेल खाती? हो सकता है कि मेरा दिमाग आज थोड़ा तले हुए हो:/ – Nubbychadnezzar

0

लुआ 5.1, LPeg v0.12

do 
    local p = re.compile([[ 
     pattern <- ({b}/{escaped}/brackets/other)+ 
     b  <- "%b" . . 
     escaped <- "%" . 
     brackets <- { "[" ([^]%]+/escaped)* "]" } 
     other <- [^[%]+ -> cases 
    ]], { 
     cases = function(str) return (str:gsub('%a',function(a) return '['..a:lower()..a:upper()..']' end)) end 
    }) 
    local pb = re.compile([[ 
     pattern <- ({b}/{escaped}/brackets/other)+ 
     b  <- "%b" . . 
     escaped <- "%" . 
     brackets <- {: {"["} ({escaped}/bcases)* {"]"} :} 
     bcases <- [^]%]+ -> bcases 
     other <- [^[%]+ -> cases 
    ]], { 
     cases = function(str) return (str:gsub('%a',function(a) return '['..a:lower()..a:upper()..']' end)) end 
     , bcases = function(str) return (str:gsub('%a',function(a) return a:lower()..a:upper() end)) end 
    }) 
    function iPattern(pattern,brackets) 
     ('sanity check'):find(pattern) 
     return table.concat({re.match(pattern, brackets and pb or p)}) 
    end 
end 

local test     = '[ab%c%]d%%]+ o%%r %bnm' 
print(iPattern(test))  -- [ab%c%]d%%]+ [oO]%%[rR] %bnm 
print(iPattern(test,true)) -- [aAbB%c%]dD%%]+ [oO]%%[rR] %bnm 
print(('qwe [%D]% O%r n---m asd'):match(iPattern(test, true))) -- %D]% O%r n---m 

शुद्ध लुआ संस्करण:

012,

स्ट्रिंग में सभी वर्णों को एक सही पैटर्न में बदलने के लिए यह आवश्यक है क्योंकि लुआ पैटर्न में regexps (abc | something) जैसे विकल्प नहीं हैं।

function iPattern(pattern, brackets) 
    ('sanity check'):find(pattern) 
    local tmp = {} 
    local i=1 
    while i <= #pattern do    -- 'for' don't let change counter 
     local char = pattern:sub(i,i) -- current char 
     if char == '%' then 
      tmp[#tmp+1] = char   -- add to tmp table 
      i=i+1      -- next char position 
      char = pattern:sub(i,i) 
      tmp[#tmp+1] = char 
      if char == 'b' then   -- '%bxy' - add next 2 chars 
       tmp[#tmp+1] = pattern:sub(i+1,i+2) 
       i=i+2 
      end 
     elseif char=='[' then   -- brackets 
      tmp[#tmp+1] = char 
      i = i+1 
      while i <= #pattern do 
       char = pattern:sub(i,i) 
       if char == '%' then  -- no '%bxy' inside brackets 
        tmp[#tmp+1] = char 
        tmp[#tmp+1] = pattern:sub(i+1,i+1) 
        i = i+1 
       elseif char:match("%a") then -- letter 
        tmp[#tmp+1] = not brackets and char or char:lower()..char:upper() 
       else       -- something else 
        tmp[#tmp+1] = char 
       end 
       if char==']' then break end -- close bracket 
       i = i+1 
      end 
     elseif char:match("%a") then -- letter 
      tmp[#tmp+1] = '['..char:lower()..char:upper()..']' 
     else 
      tmp[#tmp+1] = char   -- something else 
     end 
     i=i+1 
    end 
    return table.concat(tmp) 
end 

local test     = '[ab%c%]d%%]+ o%%r %bnm' 
print(iPattern(test))  -- [ab%c%]d%%]+ [oO]%%[rR] %bnm 
print(iPattern(test,true)) -- [aAbB%c%]dD%%]+ [oO]%%[rR] %bnm 
print(('qwe [%D]% O%r n---m asd'):match(iPattern(test, true))) -- %D]% O%r n---m 
+0

स्टैक ओवरफ्लो में आपका स्वागत है। सबसे अच्छे जवाब आमतौर पर केवल कोड नहीं होते हैं। वे कोड की व्याख्या करते हैं, या जहां ओपी उनके प्रयासों में गलत हो गया था। –