मैं डिकोडिंग टेक्स्ट पर काम कर रहा हूं। मैं —
चरित्र के लिए वर्ण कोड खोजने की कोशिश कर रहा हूं, ASCII में -
के लिए गलत नहीं होना चाहिए। मैंने असफल प्रयास किया है। क्या कोई जानता है कि इसे कैसे परिवर्तित किया जाए? विकी है'-' के लिए ASCII वर्ण कोड क्या है?
उत्तर
कोटेशन (Em dash)
जब एक वास्तविक एम डैश अनुपलब्ध-के रूप में सेट-एक ASCII वर्ण डबल ("-") में है या ट्रिपल हाइफ़न-माइनस ("---") प्रयोग किया जाता है। यूनिकोड में, एम डैश यू + 2014 (दशमलव 8212) है।
एम डैश चरित्र ASCII चरित्र सेट का हिस्सा नहीं है।
तो जब मैं करता हूं: 'char check = s.charAt (0) ', जब s =' -', मुझे क्या मिलेगा? क्या आप कहते हैं कि अगर मैं 'int check = s.charAt (0)' करूंगा, तो मुझे 8212 मिलेगा? –
@AdamSh यह डिकोडिंग करने के लिए आप जो उपयोग कर रहे हैं उस पर निर्भर करता है। आपने कोई कोड पोस्ट नहीं किया है, इसलिए यह कहना मुश्किल है। आम तौर पर जब एक डिकोडर कुछ मुठभेड़ करता है तो यह डीकोड नहीं कर सकता है, इसे एक प्रश्न चिह्न के साथ बदल देता है। – vcsjones
आपको या तो अपवाद फेंकना चाहिए या बड़े पूर्णांक का उपयोग करना शुरू करना चाहिए और 8212 लौटना चाहिए। – Li0liQ
—
को एम डैश के नाम से जाना जाता है। यह चरित्र कोड \u2014
है। यह एक ASCII चरित्र नहीं है, इसलिए आप इसे ASCII चरित्र सेट के साथ डीकोड नहीं कर सकते क्योंकि यह ASCII वर्ण तालिका में नहीं है। आप शायद इसके बजाय यूटीएफ 8 का उपयोग करना चाहते हैं।
के बराबर होगा जावास्क्रिप्ट स्ट्रिंग यूनिकोड सक्षम हैं लेकिन यूसीएस -2, आंतरिक रूप से यूटीएफ -8 का उपयोग करें। किसी भी तरह से, इसका प्रतिनिधित्व करने के लिए एन्कोडिंग को जानने की कोई आवश्यकता नहीं है, क्योंकि आप इसे '\ u2014' रूप में यूनिकोड कोड बिंदु के विरुद्ध देख सकते हैं जैसा आपने कहा था। – thomasrutter
यह वर्ण ASCII में मौजूद नहीं है, लेकिन केवल यूनिकोड में, आमतौर पर यूटीएफ -8 द्वारा एन्कोड किया जाता है।
यूटीएफ -8 में, पात्र 2- या 3-बाइट अनुक्रमों (या कभी-कभी लंबे समय तक) द्वारा एन्कोड किए जाते हैं, जहां दो या तीन बाइट्स वैध एएससीआईआई कोड नहीं है, जहां वे सभी ASCII रेंज के बाहर हैं 0 के माध्यम से 127.
एक संदिग्ध व्यक्ति जो केवल पूर्वव्यापी आपके प्रश्न का उत्तर देता है, लेकिन यदि ऐसा है तो शायद यह है क्योंकि आपका प्रश्न अनजाने में, केवल आंशिक रूप से पूछा गया है। अधिक जानकारी के लिए, आप अपने प्रश्न को अधिक विशिष्टताओं के साथ बढ़ा सकते हैं।
- 1. Regex किसी भी ASCII वर्ण
- 2. बाइट स्ट्रिंग गैर- ASCII वर्ण के साथ
- 3. टेक्स्ट फ़ाइल से गैर-ASCII वर्ण पढ़ना
- 4. रूबी 1.9 - अमान्य multibyte वर्ण (US-ASCII)
- 5. यूनिकोड वर्ण को उसके ASCII समकक्ष
- 6. वर्ण कोड या ASCII कोड मान के अनुसार टेक्स्ट फ़ाइल को सॉर्ट करने के लिए कैसे करें?
- 7. println() ASCII कोड शून्य
- 8. क्या कोई ऐसा फ़ंक्शन है जो किसी वर्ण के ASCII मान को लौटाता है? (C++)
- 9. कोड पेज और वर्ण एन्कोडिंग के बीच क्या अंतर है?
- 10. क्या मुझे गैर-ASCII वर्णों के लिए web.config चाहिए?
- 11. उनके निकटतम ASCII समकक्ष (स्लग निर्माण) में कनवर्ट गैर- ASCII वर्ण (उमलॉट लहजे ...)
- 12. क्या पोस्टग्रेस्क्ल वर्चर यूनिकोड वर्ण की लंबाई या ASCII वर्ण की लंबाई का उपयोग कर गिनती करता है?
- 13. मैं गूंज का उपयोग करके गैर-ASCII वर्ण कैसे लिखूं?
- 14. '?' (प्रश्न चिह्न) का उपयोग कर रूबी में एक ASCII वर्ण कोड प्राप्त करना
- 15. त्रुटि: असंगत वर्ण एन्कोडिंग: UTF-8 और ASCII-8bit
- 16. मैक्रो नामों के लिए मान्य वर्ण क्या हैं?
- 17. मैं पर्ल में विस्तारित ASCII कोड वर्ण कैसे प्रदर्शित कर सकता हूं?
- 18. सिंटैक्स त्रुटि: गैर- ASCII वर्ण फ़ाइल में '\ xa3' समारोह रिटर्न '£'
- 19. लिनक्स कमांड या बैश सिंटैक्स जो अगले ASCII वर्ण
- 20. बैश: ASCII
- 21. "लंबा" दायां शेवरॉन के लिए HTML यूनिकोड वर्ण क्या है?
- 22. # साइन के लिए HTML वर्ण इकाई क्या है?
- 23. एक वर्ण कोड को चार (VB.NET) में परिवर्तित करना
- 24. ASCII चार सी में रूपांतरण के लिए int
- 25. कैरेक्टर सेट जो ASCII
- 26. (grep) Regex गैर-ASCII वर्णों से मेल खाने के लिए?
- 27. मल्टीबाइट वर्ण सेट क्या है?
- 28. क्यों यूआरएल एनकोड, या जो वर्ण एन्कोड करने के लिए
- 29. क्या एस्केप वर्ण \ है u000a
- 30. एएस 3: एएससीआई कोड को वर्ण क्रियालेख में परिवर्तित करने के लिए
'इस डिकोड को डीकोड' से आपका क्या मतलब है? स्रोत टेक्स्ट में क्या एन्कोडिंग का उपयोग किया जाता है, और परिणामस्वरूप कौन सी एन्कोडिंग का उपयोग किया जाना चाहिए? – raina77ow
@ raina77ow: मैं असीसी तालिका –
में इस char की संख्या को खोजने का प्रयास करता हूं; यह वहां नहीं है; इसलिए, इसका कोड इस बात पर निर्भर करता है कि एन्कोडिंग का उपयोग किस प्रकार किया जाता है। उदाहरण के लिए, लैटिन -1 ग्रंथों में 'mdash' को 151 के साथ दर्शाया गया है। – raina77ow