संभव डुप्लिकेट:
What is the best way to remove accents in a python unicode string?
Python and character normalizationको हटाने के लहजे और विशेष वर्ण
मैं, लहजे को दूर लोअरकेस सभी पात्रों की बारी है, और किसी भी संख्या और विशेष वर्ण को नष्ट करना चाहते हैं।
उदाहरण:
Frédér8ic @ -> Frederic
प्रस्ताव:
def remove_accents(data):
return ''.join(x for x in unicodedata.normalize('NFKD', data) if \
unicodedata.category(x)[0] == 'L').lower()
वहाँ यह करने के लिए किसी भी बेहतर तरीका है?
क्या आप वांछित इनपुट और आउटपुट के कुछ उदाहरणों को शामिल करने के लिए अपना उत्तर संपादित कर सकते हैं? –
@ क्रिस्टियन जोनासेन Frédér8ic @ -> frederic @@ àbcd -> abcd% * tréçd -> trecd – Fred
मैं पायथन 3.x – Fred