2012-10-05 16 views
5

कुछ बाइट अनुक्रम यूनिकोड एन्कोडिंग में स्पष्ट रूप से अमान्य हैं, और मुझे पता है कि कुछ भाषाओं (एक के लिए पायथन) ऐसा होता है जब कोई त्रुटि होती है।यूनिकोड और जावास्क्रिप्ट: अमान्य बाइट अनुक्रम

मेरा प्रश्न है: XMLHttpRequest या XDomainRequest के दौरान ऐसा अनुक्रम प्राप्त करते समय जावास्क्रिप्ट में क्या होता है? परिणामस्वरूप स्ट्रिंग:

  1. ऐसा होने पर छंटनी हो जाती है?
  2. खराब अनुक्रम छोड़ें और अगले बाइट्स पर शुरू करें?
  3. डीकोडिंग जारी रखें और केवल प्रदर्शित होने पर प्रतिस्थापन वर्ण दिखाएं?

यदि 3, तो charCodeAt फ़ंक्शन एक वैध वर्ण कोड देता है?

उत्तर

4

संख्या 3 होता है। यह प्रदर्शित होने पर दिखाता है, और charCodeAt 0xFFFD, यूनिकोड वर्ण देता है।

+0

ठीक है, धन्यवाद, यही वह था जिसे मैं ढूंढ रहा था। रिकॉर्ड के लिए, मैंने बस [इस पृष्ठ] (http://www.cl.cam.ac.uk/~mgk25/ucs/examples/UTF-8-test.txt) का उपयोग करके इसकी पुष्टि की और 'charCodeAt' के माध्यम से पुनरावृत्ति की मान। –

+0

एक महान परीक्षण संसाधन: http://www.cl.cam.ac.uk/~mgk25/ucs/examples/UTF-8-test.txt – saml

संबंधित मुद्दे