मुझे लगता है कि यह काफी हद तक ऐतिहासिक है, लेकिन वहाँ एक स्पष्ट अंतर है की जाँच कर सकते हैं। एक कोड पृष्ठ एक लुक-अप तालिका है, एक विशिष्ट बाइट मानचित्र एक विशिष्ट चरित्र के लिए। विभिन्न कोड पेज अलग मैपिंग का उपयोग करते हैं। पुराने दिनों में, उन मैपिंग वास्तव में नहीं किए गए थे। जिनके लिए आपको फोंट भी होना चाहिए जिनके पास कोड पेज से मेल खाने के लिए ग्लिफ थे। आज भी एक समस्या btw, कंसोल विंडोज़ एक कोड पेज है।
यूनिकोड एन्कोडिंग में कोई मैपिंग नहीं है। उन्हें केवल 32-बिट्स को एक कुशल प्रारूप में निचोड़ने की आवश्यकता है। विभिन्न यूनिकोड एन्कोडिंग बिट्स को निचोड़ने के विभिन्न तरीकों का उपयोग करते हैं। चरित्र में हमेशा एक निश्चित मान होता है (यूनिकोड बोलने में कोडपॉइंट)।
यूटीएफ एन्कोडेड टेक्स्ट फ़ाइलों में बीओएम होना चाहिए, जिससे पाठक एन्कोडिंग को स्वत: पहचानने की अनुमति देता है। टेक्स्ट पेजों के लिए ऐसा कोई सम्मेलन मौजूद नहीं है जो कोड पृष्ठ से एन्कोड किए गए थे। उनमें से अच्छा पाठ प्राप्त करना एक बकवास शूट का थोड़ा सा है। यह एक बुराई है जो पहले से ही मरनी चाहिए :)
स्रोत
2010-08-25 21:04:44
+1 लेख लिंक के लिए धन्यवाद! –