इन नेट में आप किसी भी पत्र से मेल खाने के लिए \p{L}
का उपयोग कर सकते हैं, मैं पाइथन में ऐसा कैसे कर सकता हूं? अर्थात्, मैं किसी भी अपरकेस, लोअरकेस, और उच्चारण अक्षरों से मेल खाना चाहता हूं।किसी भी यूनिकोड अक्षर से मेल खाते हैं?
उत्तर
पायथन का re
मॉड्यूल अभी तक यूनिकोड गुणों का समर्थन नहीं करता है। लेकिन आप re.UNICODE
ध्वज का उपयोग करके अपने रेगेक्स को संकलित कर सकते हैं, और फिर वर्ण वर्ग शॉर्टेंड \w
यूनिकोड अक्षरों से मेल खाएगा।
के बाद से \w
भी अंक से मेल खाएगी, तो आप अपने चरित्र वर्ग से उन घटाना, अंडरस्कोर के साथ की जरूरत है:
[^\W\d_]
किसी भी यूनिकोड पत्र से मेल खाएगी।
>>> import re
>>> r = re.compile(r'[^\W\d_]', re.U)
>>> r.match('x')
<_sre.SRE_Match object at 0x0000000001DBCF38>
>>> r.match(u'é')
<_sre.SRE_Match object at 0x0000000002253030>
चालाक, लेकिन यह काम नहीं लग रहा है। अद्यतन देखें। मैंने http://en.wikipedia.org/wiki/List_of_Unicode_characters के ई बंद की प्रतिलिपि बनाई है, ऐसा लगता है कि यह इसे पहचानने में प्रतीत नहीं होता है। – mpen
यह पूरी तरह से काम करता है, लेकिन '' '' 'यूनिकोड ऑब्जेक्ट नहीं है, यह बाइट्स की एक स्ट्रिंग है। –
धन्यवाद दोस्तों! डर्न यूनिकोड :) समस्या के अलावा कुछ भी नहीं। – mpen
- 1. माणिक regex: से मेल खाते हैं और
- 2. रेगेक्स - सभी घटनाओं से मेल खाते हैं?
- 3. रेगुलर एक्सप्रेशन: पहला अंतरिक्ष जब तक किसी भी शब्द से मेल खाते हैं
- 4. कैसे जांचें कि किसी सूची के सभी तत्व किसी शर्त से मेल खाते हैं या नहीं?
- 5. यूनिकोड स्ट्रिंग अक्षर
- 6. MySQL यूनिकोड अक्षर
- 7. तालिका से रिकॉर्ड्स हटाएं जो किसी सरणी में डेटा से मेल खाते हैं?
- 8. आप नियमित अभिव्यक्ति में दो शब्दों में से किसी एक से कैसे मेल खाते हैं?
- 9. Pymongo AssertionError: आईडी से मेल नहीं खाते
- 10. django फ़िल्टर icontains केवल पूरे शब्द से मेल खाते हैं
- 11. आप रेगेक्स में कैरेट (^) प्रतीक से कैसे मेल खाते हैं?
- 12. नियमित अभिव्यक्ति - सभी शब्दों से मेल खाते हैं लेकिन केवल
- 13. इस पैटर्न से मेल खाते कोड
- 14. रेगुलर एक्सप्रेशन से (में जावास्क्रिप्ट को खोजने/बदलें) - गैर अक्षरांकीय अक्षर से मेल खाते हैं, लेकिन उपेक्षा - और +
- 15. क्या हम किसी सामान्य प्रकार से मेल खाते हैं? [स्कैला 2.8]
- 16. वैरिएबल: टेम्पलेट से मेल खाते नमूने
- 17. एक नियमित अभिव्यक्ति में, एक चीज़ या किसी अन्य से मेल खाते हैं, या दोनों
- 18. ऐसी गतिविधियां कैसे सूचीबद्ध करें जो किसी इरादे से मेल खाते हैं?
- 19. स्काला एक्सएमएल पैटर्न से मेल खाते और गुण सभी का
- 20. आप आईडीस्पोजेबल और आईओसी को कैसे मेल खाते हैं?
- 21. एपीआई दस्तावेज और "मूल्य सीमाएं": क्या वे मेल खाते हैं?
- 22. मैं तारों से कैसे मिलान कर सकता हूं जो पर्ल में किसी विशेष पैटर्न से मेल नहीं खाते हैं?
- 23. किसी भी डोमेन से मेल प्राप्त करने के लिए मेल सर्वर कॉन्फ़िगर करें
- 24. किसी भी पेपैल खाते में पैसा कैसे भेजें
- 25. Emacs Lisp: कॉम्पैक्ट तरीके से दोहराए गए पैटर्न से मेल खाते हैं?
- 26. अंदर प्रवेश करता है ... चुनें ... हमेशा क्रमिक स्थिति से खेतों से मेल खाते हैं?
- 27. पीईक्यूटी -> कनेक्ट() -> टाइप एरर: तर्क किसी ओवरलोडेड कॉल से मेल नहीं खाते
- 28. जावा 6 स्ट्रिंग अक्षर में यूनिकोड से बचने में समस्या ...?
- 29. OpenCV - इनपुट तर्क के आकार से मेल नहीं खाते - addWeighted
- 30. मोंगोडीबी: उन सभी संग्रहों को हटाकर जिनके नाम स्ट्रिंग से मेल खाते हैं
देखें: http://stackoverflow.com/questions/1832893/python-regex-matching-unicode-properties –
तुम्हें पता है कि ' 'é'' [2.x में एक' unicode' नहीं है ] (http://farmdev.com/talks/unicode/), है ना? –
'r.match (u'é') ' –