एचटीएमएल इकाइयों को तार पर चरित्र जानकारी परिवहन के लिए कई साल पहले पेश किया गया था जब परिवहन बाइनरी सुरक्षित नहीं था और मामले के लिए उपयोगकर्ता-एजेंट (ब्राउज़र) ने परिवहन-परत या सर्वर के वर्णसेट एन्कोडिंग का समर्थन नहीं किया था।
एक HTML इकाई केवल मूलभूत वर्ण (&
, ;
, a-z
और 0-9
) और उन वर्ण हैं के रूप में सबसे अधिक वर्ण सेट में एक ही द्विआधारी कूटबन्धन है, यह है और उन दुष्प्रभाव से बहुत सुरक्षित था।
हालांकि जब आप डेटाबेस में कुछ संग्रहीत करते हैं, तो आपके पास इन मुद्दों का कोई कारण नहीं है क्योंकि आप आमतौर पर नियंत्रण में हैं और आप जानते हैं कि आप डेटाबेस में टेक्स्ट को कैसे और कैसे स्टोर कर सकते हैं।
उदाहरण के लिए, यदि आप डेटाबेस के अंदर यूनिकोड को टेक्स्ट के लिए अनुमति देते हैं, तो आप सभी पात्रों को स्टोर कर सकते हैं, कोई भी वास्तव में विशेष नहीं है। ध्यान दें कि आपको यहां अपना डेटाबेस जानने की जरूरत है, कुछ तकनीकी विवरण हैं जिन्हें आप चला सकते हैं। जैसे कि आप अपने डेटाबेस कनेक्शन के लिए वर्णसेट एन्कोडिंग नहीं जानते हैं, इसलिए आप अपने डेटाबेस को बिल्कुल बता नहीं सकते कि आप कौन सा टेक्स्ट स्टोर करना चाहते हैं। लेकिन आम तौर पर, आप बस पाठ को स्टोर करते हैं और इसे बाद में पुनर्प्राप्त करते हैं। निपटने के लिए कुछ खास नहीं है।
असली मजा शुरू होता है जब आप दोनों अवधारणाओं को मिश्रण करते हैं। आप ऐसे स्थान पर आते हैं जहां आप वास्तव में नहीं जाना चाहते हैं। तो बस ऐसा मत करो क्योंकि आपको इसकी आवश्यकता नहीं है।
मैंने आपके शीर्षक को थोड़ा बदलने की स्वतंत्रता ली - आपका शीर्षक ठीक था, लेकिन इस तरह, भविष्य के समान प्रश्नों के लिए खोजना आसान है। (मैंने अभी खोजा और महसूस किया कि इसमें कोई आसान-खोज-डुप्लिकेट नहीं है।) –
यह उस वर्णमाला पर निर्भर करता है जहां कॉलम उस HTML का उपयोग कर रहा है जहां आप HTML संग्रहीत करते हैं। आम तौर पर आपको एक वर्णमाला का उपयोग करना चाहिए जिसमें सभी वर्ण शामिल हैं (इसलिए कोई भी "विशेष" नहीं है) और आपका डेटा सामान्यीकृत रूप में संग्रहीत किया जा सकता है और इसमें नंगे वर्णमाला एन्कोडिंग के बगल में कोई विशेष एन्कोडिंग नहीं है जो डेटाबेस में प्रत्येक टेक्स्ट-फ़ील्ड में है वैसे भी। – hakre
@ पेक्का यह ठीक है। अगर यह इस तरह से मददगार है, तो मुझे आपको धन्यवाद देना चाहिए। –