आप उपयोग कर सकते हैं कि ASCII वर्ण पहले 128 लोगों को है, इसलिए ord
साथ हर किरदार की संख्या हो और पट्टी यह अगर यह सीमा से बाहर
# -*- coding: utf-8 -*-
def strip_non_ascii(string):
''' Returns the string without non ASCII characters'''
stripped = (c for c in string if 0 < ord(c) < 127)
return ''.join(stripped)
test = u'éáé123456tgreáé@€'
print test
print strip_non_ascii(test)
परिणाम
éáé123456tgreáé@€
[email protected]
है कृपया ध्यान दें कि @
शामिल है क्योंकि, ठीक है, इसके बाद यह एक ASCII चरित्र है। यदि आप एक विशेष सबसेट (जैसे संख्याओं और अपरकेस और लोअरकेस अक्षरों) को पट्टी करना चाहते हैं, तो आप ASCII table
संपादित करने वाली श्रेणी को सीमित कर सकते हैं संपादित करें: फिर से अपना प्रश्न पढ़ने के बाद, शायद आपको अपने HTML कोड से बचने की आवश्यकता है, इसलिए एक बार प्रस्तुत किए जाने वाले सभी वर्ण सही ढंग से दिखाई देते हैं। आप अपने टेम्पलेट्स पर escape
फ़िल्टर का उपयोग कर सकते हैं।
का उपयोग करके आप उन्हें क्यों बदलना चाहते हैं? यदि आपके पास यूनिकोड सही है तो उन्हें केवल पृष्ठ में ठीक दिखाना चाहिए। आप जो कुछ भी करते हैं, ** ** ** अपने डेटाबेस में एचटीएमएल-एन्कोडेड डेटा डालें। बॉबेंस के लिए – bobince
+1: क्या आप वाकई उन्हें बदलना चाहते हैं? आपको केवल उस ब्राउज़र को बताना होगा जिसे आप मेटा टैग जोड़कर '<मेटा http-equiv = "सामग्री-प्रकार" सामग्री = "टेक्स्ट/html; charset = utf-8" /> ' –