एचटीएमएल आउटपुट करते समय, कई अलग-अलग जगहें हैं जहां पाठ को अक्षर अक्षर के बजाय नियंत्रण वर्णों के रूप में व्याख्या किया जा सकता है। उदाहरण के लिए, "नियमित" पाठ में (जो किसी भी तत्व मार्कअप के बाहर है):सभी एचटीएमएल से बचने वाले संदर्भ क्या हैं?
<div>This is regular text</div>
साथ ही
विशेषताओं के मान के भीतर:
<input value="this is value text">
और, मुझे विश्वास है, एचटीएमएल टिप्पणियों के भीतर:
<!-- This text here might be programmatically generated
and could, in theory, contain the double-hyphen character
sequence, which is verboten inside comments -->
पाठ के इन तीन प्रकार से प्रत्येक यह कैसे बच गए किया जाना चाहिए क्रम गैर मार्कअप के रूप में इलाज किया जा करने के लिए के लिए अलग नियम हैं। तो मेरा पहला सवाल है, क्या HTML में कोई अन्य संदर्भ हैं जिसमें वर्णों को मार्कअप/नियंत्रण वर्णों के रूप में व्याख्या किया जा सकता है? उपर्युक्त संदर्भों में स्पष्ट रूप से अलग-अलग नियम हैं जिनसे बचने की आवश्यकता है।
दूसरा सवाल यह है कि वर्णों की प्रत्येक कैनोलिक, वैश्विक रूप से सुरक्षित सूचियां (प्रत्येक संदर्भ के लिए) क्या हैं, यह सुनिश्चित करने के लिए कि किसी भी एम्बेडेड टेक्स्ट को गैर-मार्कअप के रूप में माना जाता है, से बचने की आवश्यकता है? उदाहरण के लिए, सिद्धांत में आपको केवल गुण मानों में 'और "से बचने की आवश्यकता है, क्योंकि एक विशेषता मान के भीतर केवल क्लोजिंग-डेलीमीटर वर्ण (' या" जिसके आधार पर विशेषता मान के साथ शुरू होता है) पर नियंत्रण का अर्थ होगा। इसी प्रकार, "नियमित" पाठ के भीतर केवल < और & का नियंत्रण अर्थ होता है। (मुझे एहसास है कि सभी एचटीएमएल पार्सर्स समान नहीं हैं। मुझे अधिकतर दिलचस्पी है कि स्पेस-कॉन्फॉर्मिंग पार्सर को खुश करने के लिए बचने वाले पात्रों का न्यूनतम सेट क्या है।)
टेंगेंशियल: निम्न पाठ त्रुटियों को फेंक देगा HTML 4.01 स्ट्रिक्ट के रूप में:
<a href="http://example.com/file.php?x=1&y=2">foo</a>
विशेष रूप से, यह कहना है कि वह नहीं जानता है कि क्या इकाई "& वाई" माना जाता है। यदि आप & के बाद कोई स्थान डालते हैं, हालांकि, यह ठीक है। लेकिन यदि आप इसे फ्लाई पर उत्पन्न कर रहे हैं, तो संभवतः आप यह जांचना नहीं चाहते हैं कि & का प्रत्येक उपयोग सत्यापन त्रुटि का कारण बनता है, और इसके बजाय विशेषता मानों के अंदर सभी & से बचें।
पढ़ सकते हैं संयोग से, मुझे पता नहीं है कि कोई भी के लिए "अनुक्रम पलायन" - एक HTML टिप्पणी के अंदर; वे केवल निषिद्ध हैं (क्योंकि टिप्पणियों को पार्सर द्वारा अनदेखा किया जाता है और प्रस्तुत नहीं किया जाता है, इसलिए एक भागने का अनुक्रम कोई उद्देश्य नहीं देगा)। अगर किसी कारण से आपको एक टिप्पणी शामिल करने की आवश्यकता है जिसमें शामिल है -, आपको या तो इसे कम करने या इसे कम आक्रामक (उदाहरण के लिए यू + 2014 ईएम DASH) के साथ प्रतिस्थापित करने की आवश्यकता होगी। – dirtside
तो बस अपना प्रश्न क्या है। – Kieran