मेरे पूर्ववर्तियों की त्रुटियों के कारण एक (MySQL) डेटाबेस मैं उपयोग करना चाहता हूं जिसमें कई HTML इकाइयां हैं (उदा। €
€
के बजाय)।डेटाबेस से एचटीएमएल इकाइयों को हटाएं
डेटाबेस कच्चे डेटा होना चाहिए जैसा कि मैंने उन्हें डीबी से हटा दें और उचित UTF8 में संग्रहीत करना चाहते हैं (एक डेटाबेस HTML के साथ कोई लेना देना नहीं होना चाहिए), मोरचा पहले से ही है।
इसे ठीक करने का एक अच्छा तरीका क्या होगा? एकमात्र चीज जिसे मैं सोच सकता हूं वह एक PHP स्क्रिप्ट लिखना है जो सभी डेटा प्राप्त करता है, इसे html_entity_decode() के माध्यम से चलाता है और इसे वापस लिखता है। यह एक करने योग्य है क्योंकि यह एक बार का ऑपरेशन है और डीबी केवल 100 एमबी बड़ा है, लेकिन यह अभी भी इष्टतम से कम है।
कोई भी विचार?
हो जाएगा यह केवल कुछ अलग वर्ण है, तो आप शायद सरल तार के साथ एक अद्यतन क्वेरी कर सकता है खोज/बदलें। लेकिन अगर यह एक विस्तृत विविधता है, तो PHP राउंड-ट्रिप विकल्प के साथ जाएं। –
अकेले इस डेटाबेस में 50 से अधिक इकाइयां उपयोग में हैं, और एचटीएमएल xx; सिंटैक्स का उपयोग करके प्रत्येक चरित्र को एचटीएमएल इकाई के रूप में लिखा जा सकता है, इसलिए यह खोज और प्रतिस्थापन जितना आसान नहीं है। – dtech