मुझे मिली टिप्पणियों के आधार पर, मैंने इसे थोड़ा और आगे देखा। ऐसा लगता है कि वर्तमान में सर्वोत्तम अभ्यास एचटीएमएल इकाइयों का उपयोग करना है और के बजाय वास्तविक यूटीएफ -8 वर्ण का उपयोग करना है। इनमें से किसी कारण इस प्रकार हैं:
- UTF-8 एनकोडिंग जो लोग समझते हैं कि चरित्र का मतलब है और पता है कि यह कैसे टाइप करने के लिए आसान पढ़ सकते हैं और संपादित करने के लिए कर रहे हैं।
- यूटीएफ -8 एन्कोडिंग उन लोगों के लिए HTML इकाई एन्कोडिंग के रूप में अनजान हैं जो उन्हें समझ में नहीं आते हैं, लेकिन उनके पास दशमलव या हेक्स एन्कोडिंग को समझने के बजाय कठिन वर्णों के रूप में प्रतिपादन का लाभ होता है।
जब तक आपके पृष्ठ का एन्कोडिंग यूटीएफ -8 पर ठीक से सेट हो, तब तक आपको HTML इकाई के बजाय वास्तविक वर्ण का उपयोग करना चाहिए। मैं इस विषय के बारे में कई दस्तावेजों को पढ़ने, लेकिन सबसे मददगार साबित हुईं:
से
UTF-8: वर्ण एन्कोडिंग का रहस्य लेख:
विकिपीडिया एप्लिकेशन के लिए एक महान केस स्टडी है जो मूल रूप सेका उपयोग करता थाआईएसओ -885 9 -1 लेकिन यूटीएफ -8 पर स्विच किया गया जब विदेशी भाषाओं का समर्थन करने के लिए यह बहुत बोझिल हो गया। बॉट अब वास्तव में लेख के माध्यम से जाना होगा और उपयोगकर्ता के मित्रता की खातिर और खोज योग्यता के लिए अपने इसी वास्तविक पात्रों को चरित्र संस्थाओं कन्वर्ट।
यह लेख चीनी एन्कोडिंग को शामिल करने वाला एक अच्छा उदाहरण भी देता है।
UTF-8:
這兩個字是甚麼意思
एचटीएमएल संस्थाओं:
這兩個字是甚麼意思
UTF-8 और एचटीएमएल यहाँ आलस्य की खातिर संक्षिप्त उदाहरण है इकाई एन्कोडिंग दोनों मेरे लिए व्यर्थ हैं, लेकिन कम से कम यूटीएफ -8 एन्कोडिंग है एक विदेशी भाषा के रूप में पहचानने योग्य, और यह एक संपादन बॉक्स में ठीक से प्रस्तुत करेगा।लेख HTML इकाई एन्कोड संस्करण के बारे में निम्नलिखित कहना है:
हमें में से जो लोग वास्तव में पता है कि चरित्र संस्थाओं जो ऐसा नहीं करते गरीब उपयोगकर्ताओं के लिए कर रहे हैं, पूरी तरह से अस्पष्ट के लिए अत्यंत असुविधाजनक! यहां तक कि थोड़ा अधिक उपयोगकर्ता के अनुकूल, "समझदार" चरित्र इकाइयां & थीटा; उन उपयोगकर्ताओं को छोड़ देगा जो एचटीएमएल सीखने में रुचि रखते हैं उनके सिर खरोंच करते हैं। अन्य हाथ पर, यदि वे एक संपादन बॉक्स में θ देखते हैं, उन्हें पता चलेगा कि यह एक विशेष वर्ण है, और तदनुसार इसका इलाज करें, भले ही वे लिखने के बारे में नहीं जानते हैं।
जैसा कि अन्य ने ध्यान दिया है, आपको अभी भी आरक्षित एक्सएमएल अक्षरों (एम्पर्सेंड, कम से कम, उससे अधिक) के लिए HTML इकाइयों का उपयोग करना होगा।
स्रोत
2009-01-12 19:19:28
एक तरफ ध्यान दें, PHP में htmlentities() क्या करेंगे? –
उत्तर और टिप्पणियां पढ़ना मुझे लगता है कि अभी तक एक या दूसरे के पक्ष में एक सार्वभौमिक नियम नहीं है, और उत्तर अभी भी है * यह निर्भर करता है *। –