मैं यूनिकोड कोड पॉइंट्स की एक सरणी बनाना चाहता हूं जो जावास्क्रिप्ट में श्वेत स्थान का गठन करे (यूनिकोड-व्हाइट-स्पेस कोड पॉइंट्स को घटाएं, जिसे मैं अलग से संबोधित करता हूं)। ये वर्ण क्षैतिज टैब, लंबवत टैब, फॉर्म फ़ीड, स्थान, गैर-ब्रेकिंग स्पेस और बीओएम हैं। मैं जादू संख्याओं के साथ ऐसा कर सकता था:मैं पाइथन में अपने नाम से यूनिकोड चरित्र कैसे निर्धारित कर सकता हूं, भले ही वह चरित्र एक नियंत्रण चरित्र है?
whitespace = [0x9, 0xb, 0xc, 0x20, 0xa0, 0xfeff]
यह थोड़ा अस्पष्ट है; नाम बेहतर होंगे। unicodedata.lookup
विधि ord
के माध्यम से पारित कुछ मदद करता है:
>>> ord(unicodedata.lookup("NO-BREAK SPACE"))
160
लेकिन इस 0x9, 0xb, या 0xc के लिए काम नहीं करता है - मुझे लगता है कि क्योंकि वे नियंत्रण वर्ण हैं, और "नाम" फार्म फ़ीड और इस तरह कर रहे हैं बस उपनाम नाम। क्या मानक पायथन में इन "नामों" को वर्णों, या उनके कोड बिंदुओं को मैप करने का कोई तरीका है? या मैं भाग्य से बाहर हूँ?
कितना अस्पष्ट - यदि यह एक-एक, वैश्विक स्तर पर निरंतर सूची है, तो क्या आप केवल संख्या अक्षर लिख नहीं सकते हैं और यूनिकोड नाम को टिप्पणी में डाल सकते हैं? –
एक टिप्पणी अपठनीयता मुद्दे को संबोधित करेगी। लेकिन यह इस मुद्दे को संबोधित नहीं करता है कि पाठक को अंधविश्वास पर स्वीकार करना चाहिए कि संख्याएं सही हैं। (माना जाता है कि इनमें से कुछ बहुत प्रसिद्ध हैं, लेकिन यह हमेशा मामला नहीं होने वाला है।) अगर अंत में यह बात आती है तो मैं अंत में टिप्पणी करने के लिए बसूंगा, लेकिन यदि इससे बचना संभव है, तो यह बेहतर लगता है मेरे लिए। –
यह एक समस्या क्यों होगी? संख्या * सभी के बाद मानकीकृत हैं। क्या आपके ग्राहकों को डर है कि आप उन्हें किसी तरह से धोखा देंगे? –