जब आप यूआरआई द्वारा मान्यता का उपयोग करते हैं, तो सर्वर को Content-Type
शीर्षलेख मान के charset
पैरामीटर में HTTP हेडर में वर्ण एन्कोडिंग की घोषणा करना चाहिए।इस मामले में, यह स्पष्ट रूप से नहीं होता है। आप स्थिति की जांच कर सकते हैं उदा। Rex Swain's HTTP Viewer का उपयोग कर।
एचटीएमएल 5 सीआर में खंड
4.2.5.5 Specifying the document's character encoding के अनुसार
, "एक HTML दस्तावेज एक बीओएम के साथ शुरू नहीं करता है, और इसकी एन्कोडिंग स्पष्ट सामग्री प्रकार मेटाडाटा द्वारा नहीं दिया जाता है, और दस्तावेज़ नहीं एक iframe srcdoc दस्तावेज़, तो चरित्र है एन्कोडिंग का उपयोग एएससीआईआई-संगत चरित्र एन्कोडिंग होना चाहिए, और एन्कोडिंग को एनाोडिंग घोषणा स्थिति में एक http-equiv विशेषता के साथ एक वर्णमाला विशेषता या मेटा तत्व के साथ मेटा तत्व का उपयोग करके निर्दिष्ट किया जाना चाहिए। "यह थोड़ा जटिल है, लेकिन निचली पंक्ति है: एन्कोडिंग घोषित करने के कई तरीके हैं, लेकिन यदि उनमें से कोई भी उपयोग नहीं किया जाता है, तो दस्तावेज़ गैर-अनुरूप है।
क्यों यह निर्दिष्ट करता है कि कुछ हद तक सट्टा है, लेकिन सामान्य विचार यह है कि ऐसे नियम विश्वसनीयता और मजबूती को बढ़ावा देते हैं। जब नियम का पालन नहीं किया जाता है, तो विभिन्न ब्राउज़र अलग-अलग डिफ़ॉल्ट या अनुमान का उपयोग कर सकते हैं।
वैधकर्ता विंडोज -1252 मानता है, क्योंकि एचटीएमएल 5 नियमों का यही कारण है। प्रसंस्करण नियम 8.2.2.1 Determining the character encoding में हैं। वे काफी जटिल हैं, लेकिन वे बड़े पैमाने पर आधुनिक ब्राउज़र के तरीके को प्रतिबिंबित करते हैं (और इसे एक मानक बनाने का लक्ष्य है)। गैर-अनुरूप दस्तावेजों से निपटने के लिए नियम भी हैं, लेकिन यह उन दस्तावेजों को अनुरूप नहीं बनाता है; त्रुटि प्रसंस्करण नियम वास्तव में "फॉलबैक" नहीं हैं और इन पर भरोसा नहीं किया जाना चाहिए, खासकर जब पुराने ब्राउज़र हमेशा नियमों से नहीं खेलते हैं।
त्रुटि नियम कुछ हद तक ढीले होते हैं जब ऐसी स्थिति की बात आती है जहां सबकुछ विफल रहता है और "कार्यान्वयन-परिभाषित या उपयोगकर्ता-निर्दिष्ट डिफ़ॉल्ट वर्ण एन्कोडिंग" का उपयोग किया जाना है। ब्राउजर क्या कर सकता है, इस पर सिर्फ "सुझाव" हैं (फिर से, यह दर्शाते हुए कि आधुनिक ब्राउज़र आमतौर पर क्या करते हैं), और इसमें "अस्पष्ट अवधारणा", एक अस्पष्ट अवधारणा का उपयोग शामिल हो सकता है। सत्यापनकर्ता विंडोज -1252 का उपयोग करता है, शायद इसलिए कि यह अंग्रेजी के लिए डिफ़ॉल्ट है और वैधकर्ता अंग्रेजी बोलता है, या शायद इसलिए कि यह अनुमान है कि किसी अन्य एकल विकल्प से अधिक बार सही होने की उम्मीद है।
स्रोत
2013-07-30 08:39:17
क्या आपको लगता है कि ब्राउज़र एटीएफ -8 मानता है जब कोई एन्कोडिंग निर्दिष्ट नहीं होती है? आप किस "फॉलबैक नियम" का जिक्र कर रहे हैं? –
क्या विंडोज -1252 एन्कोडिंग काम करता है? – pattyd
दिलचस्प ... आपका एचटीएमएल उदाहरण एचटीएमएल 5/यूटीएफ 8 के रूप में मान्य करता है जब मैं इसे प्रत्यक्ष इनपुट विंडो – WebChemist