मैं कुछ गन्दा डेटा पर कुछ डेटा साफ कर रहा हूं जिसे mysql में आयात किया जा रहा है।mysql या php में 'u00e9' को utf8 char में कैसे परिवर्तित करें?
डेटा 'छद्म' यूनिकोड वर्ण, जो वास्तव में के रूप में स्ट्रिंग में एम्बेडेड रहे हैं होता है 'u00e9' आदि
तो एक क्षेत्र हो सकता है .. 'Jalostotitlu00e1n' मुझे लगता है कि अनाड़ी 'u00e1n बाहर चीर करने की जरूरत है 'और इसे संबंधित यूटीएफ चरित्र
के साथ प्रतिस्थापित करें, मैं इसे सबस्ट्रिंग और सीएचआर का उपयोग करके, या तो mysql में कर सकता हूं, लेकिन मैं PHP के माध्यम से डेटा को प्रीप्रोकैस कर रहा हूं, इसलिए मैं इसे वहां भी कर सकता था।
मुझे पहले से ही पता है कि utf डेटा के साथ काम करने के लिए mysql और php को कॉन्फ़िगर कैसे करें। समस्या वास्तव में बस स्रोत डेटा आयात में है।
धन्यवाद
कोई ऐसी है चीज "एक यूटीएफ -8 चरित्र" के रूप में। शायद आप का मतलब है "उस कोडपॉइंट के साथ यूनिकोड चरित्र का यूटीएफ -8 एन्कोडिंग"। –
@ इग्नासिओ वास्तव में, लेकिन मैं एक "यूटीएफ -8 चरित्र" को "एक, दो, तीन या चार बाइट्स का अनुक्रम" के रूप में परिभाषित करता हूं जो यूनिकोड चरित्र को एन्कोड करता है "। क्या यह वैध परिभाषा होगी? – deceze
@deceze: तकनीकी रूप से इसे "यूटीएफ -8 अनुक्रम" कहा जाता है। –