2017-04-18 7 views
7

मैं ने कहा कि एक नियमित अभिव्यक्ति के साथ या हालत दो पैटर्न युक्त, एक नमूना स्ट्रिंग से मेल नहीं खाते, तो पहले पैटर्न दूसरा स्वरूप की एक शुरुआत हिस्सा है (बजना 3.5 और बजना 3.8 पर परीक्षण):क्या यह सुविधा या क्लैंग सी ++ 11 std :: regex_match की एक बग है?

std::regex_match("ab", std::regex("(ab|a)")) == true 

लेकिन

std::regex_match("ab", std::regex("(a|ab)")) == false 

मुझे लगता है कि true दोनों ही मामलों में तार्किक रूप से सही है।

बजना & OSX:

$ cat > test.cpp 
#include <string> 
#include <regex> 
#include <iostream> 

int main() { 
    std::cout << std::regex_match("ab", std::regex("(a|ab)")) << std::endl; 
    std::cout << std::regex_match("ab", std::regex("(ab|a)")) << std::endl; 

    return 0; 
} 
^C 

$ clang++ -v 
Apple LLVM version 8.1.0 (clang-802.0.41) 
Target: x86_64-apple-darwin16.5.0 
Thread model: posix 
InstalledDir: /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin 

$ clang++ ./test.cpp -o test 

$ ./test 
0 
1 

बजना & FreeBSD:

$ cat > test.cpp 
#include <string> 
#include <regex> 
#include <iostream> 

int main() { 
    std::cout << std::regex_match("ab", std::regex("(a|ab)")) << std::endl; 
    std::cout << std::regex_match("ab", std::regex("(ab|a)")) << std::endl; 

    return 0; 
} 
^C 
$ clang++ -v 
FreeBSD clang version 3.8.0 (tags/RELEASE_380/final 262564) (based on LLVM 3.8.0) 
Target: x86_64-unknown-freebsd11.0 
Thread model: posix 
InstalledDir: /usr/bin 
$ clang++ ./test.cpp -o test 
$ ./test 
0 
1 

लिनक्स & जीसीसी:

$ cat > test.cpp 
#include <string> 
#include <regex> 
#include <iostream> 

int main() { 
    std::cout << std::regex_match("ab", std::regex("(a|ab)")) << std::endl; 
    std::cout << std::regex_match("ab", std::regex("(ab|a)")) << std::endl; 

    return 0; 
} 
^C 

$ g++ -v 
Using built-in specs. 
COLLECT_GCC=g++ 
COLLECT_LTO_WRAPPER=/usr/lib/gcc/x86_64-linux-gnu/5/lto-wrapper 
Target: x86_64-linux-gnu 
Configured with: ../src/configure -v --with-pkgversion='Ubuntu 5.4.1-2ubuntu1~16.04' --with-bugurl=file:///usr/share/doc/gcc-5/README.Bugs --enable-languages=c,ada,c++,java,go,d,fortran,objc,obj-c++ --prefix=/usr --program-suffix=-5 --enable-shared --enable-linker-build-id --libexecdir=/usr/lib --without-included-gettext --enable-threads=posix --libdir=/usr/lib --enable-nls --with-sysroot=/ --enable-clocale=gnu --enable-libstdcxx-debug --enable-libstdcxx-time=yes --with-default-libstdcxx-abi=new --enable-gnu-unique-object --disable-vtable-verify --enable-libmpx --enable-plugin --with-system-zlib --disable-browser-plugin --enable-java-awt=gtk --enable-gtk-cairo --with-java-home=/usr/lib/jvm/java-1.5.0-gcj-5-amd64/jre --enable-java-home --with-jvm-root-dir=/usr/lib/jvm/java-1.5.0-gcj-5-amd64 --with-jvm-jar-dir=/usr/lib/jvm-exports/java-1.5.0-gcj-5-amd64 --with-arch-directory=amd64 --with-ecj-jar=/usr/share/java/eclipse-ecj.jar --enable-objc-gc --enable-multiarch --disable-werror --with-arch-32=i686 --with-abi=m64 --with-multilib-list=m32,m64,mx32 --enable-multilib --with-tune=generic --enable-checking=release --build=x86_64-linux-gnu --host=x86_64-linux-gnu --target=x86_64-linux-gnu 
Thread model: posix 
gcc version 5.4.1 20160904 (Ubuntu 5.4.1-2ubuntu1~16.04) 

$ g++ -std=gnu++11 ./test.cpp -o test 

$ ./test 
1 
1 
+2

[जीसीसी 6.3 परीक्षण] (https://ideone.com/gUm6cL) दोनों के लिए 1 देता है। –

+2

[जीसीसी 5.4.0 परीक्षण दोनों के लिए भी 1 रिटर्न देता है।] (Https://wandbox.org/permlink/0T73YQHHS3viGIzk) –

+3

क्यों * ((std :: regex_match ("ab", std :: regex ("(a | एबी) ")) == झूठा)) * * * * हो? –

उत्तर

7

ECMAScript (डिफ़ॉल्ट regex वाक्यविन्यास) में विकल्प मिलान का प्रयास आदेश, एफ पर रोक प्यास की सफलता, जिसका मतलब है कि सामान्य खोज में (ला regex_search) रेगेक्स a|ab पूरे ab से मेल नहीं खाता; यह हमेशा a भाग से मेल खाता है।

मानक इस मामले में regex_match के बारे में अस्पष्ट था, जो कार्यान्वयन विचलन की ओर अग्रसर था। प्रतिस्पर्धी व्याख्याओं के लिए LWG issue 2273 देखें। आखिरकार मानक संशोधन किया गया था (कि इस मुद्दे के समाधान देखें) स्पष्ट करना है कि regex_match केवल संभावित मिलानों के पूरे इनपुट अनुक्रम से मेल खाते हैं पर विचार करता है, उदाहरण के मानक को जोड़ा गया के रूप में स्पष्ट करता है:

std::regex re("Get|GetValue"); 
std::cmatch m; 
regex_search("GetValue", m, re); // returns true, and m[0] contains "Get" 
regex_match ("GetValue", m, re); // returns true, and m[0] contains "GetValue" 

मूल <regex> कार्यान्वयन libC++ में अन्य व्याख्या का उपयोग किया गया, हालांकि, और इसे recently तक संकल्प से मिलान करने के लिए बस अपडेट नहीं किया गया था। क्लैंग 4.0 अब 1 1 प्रिंट करता है।

संबंधित मुद्दे