मेरे पास कई वेबसाइटें हैं जो अमान्य वर्ण प्रस्तुत कर रही हैं। पेज 'मेटा टैग यूटीएफ -8 एन्कोडिंग निर्दिष्ट करते हैं। हालांकि, कई पृष्ठों में वे वर्ण होते हैं जिन्हें यूटीएफ -8 द्वारा व्याख्या नहीं किया जा सकता है, संभवतः फाइलों को अन्य एन्कोडिंग (जैसे एएनएसआई) के साथ सहेजा गया था। विशेष रूप से मैं इस बारे में चिंतित हूं कि अभी एक फैंसी एस्ट्रोफ़े है (जैसा कि "बॉब के" में खेद है ... क्षमा करें अगर यह सही तरीके से दिखाई नहीं दे रहा है)। डब्ल्यू 3 का वैलिडेटर इंगित करता है कि इकाई "\ x92" है, लेकिन यह फ़ाइल को मान्य नहीं करेगी क्योंकि यह यूनिकोड पर मैप नहीं करती है। और, ज़ाहिर है, अगर मैं नोटपैड ++ में फ़ाइल खोलता हूं और एन्कोडिंग को यूटीएफ -8 में बदलता हूं, तो चरित्र को ब्लैक बॉक्स में 92 द्वारा प्रतिस्थापित किया जाता है।मैं अलग-अलग एन्कोडिंग वाले पृष्ठों में अमान्य HTML वर्ण कैसे ठीक करूं?
यहां मेरा प्रश्न है: इसे ठीक करने का सबसे आसान तरीका क्या है? क्या मुझे सभी पृष्ठों को खोलना है और उस चरित्र को पारंपरिक एस्ट्रोफ़े के साथ बदलना है? या क्या कोई त्वरित समाधान है जिसे मैं जोड़ सकता हूं (कहें, आईआईएस को) जो एन्कोडिंग समस्या को ओवरराइड या ठीक कर सकता है? या क्या मुझे खोजने/प्रतिस्थापित करने के लिए क्रूर बल देना है? मेरे पास इन वेबसाइटों पर सैकड़ों पेज हैं और मुझे नहीं पता कि उनमें से कितने को मुझे बदलना होगा, इसलिए अगर कोई इस तरह से जानता है तो मैं या तो इस समस्या को बाधित कर सकता हूं या इसे ठीक कर सकता हूं, मैं इसकी सराहना करता हूं।
हां, यह एक विंडोज वातावरण है। दुर्भाग्यवश, उनमें से अधिकांश एएसपी पृष्ठों में स्थिर HTML हैं। मैं देखूंगा कि यह एक संभावना है या नहीं। – Andy