मुझे चरित्र एन्कोडिंग के साथ कोई समस्या नहीं है।डेटाबेस, वर्ण एन्कोडिंग, पीडीएफ और एक्सएमएल
स्थिति
एक फ़ाइल अपलोड होने कि XML में बदल जाती है। इस फ़ाइल का चरित्र एन्कोडिंग भिन्न होता है, हालांकि स्मार्ट कोट्स, इकाइयां और विभिन्न ASCII दिखाई दे सकते हैं। एक बार यह फ़ाइल एक्सएमएल में परिवर्तित हो जाने पर इसे डेटाबेस में संग्रहीत किया जाता है। उपयोगकर्ता अनुरोध पर, एक्सएमएल डेटाबेस से निकाला जा सकता है और एक सरणी में परिवर्तित किया जा सकता है जहां इसे पीडीएफ में बनाया जाता है।
समस्या
अक्षर इनकोडिंग। शुरुआत से ही, चरित्र एन्कोडिंग ने एक बड़ा मुद्दा खेला है। मैं जानना चाहता हूँ;
- कौन सा चरित्र एन्कोडिंग आम तौर पर पूरे "स्पेक्ट्रम" को कवर करता है। उदाहरण के लिए,
°
जो XML या स्मार्ट कोट (’
) को पार्स करते समय अपरिचित है। स्मार्ट कोट’
, इत्यादि में बदल जाएगा। - डेटाबेस में XML को कैसे स्टोर करें। एन्क्रिप्शन एक संभावना है, हालांकि डेटाबेस एन्कोडिंग वह जगह है जहां मैं खो रहा हूं।
- डेटाबेस में सही ढंग से दिखाई देने और सामग्री के सामने
Å
के साथ इकाइयों, स्मार्ट कोट्स (और अन्य वर्ण जो समस्या पैदा कर सकते हैं) कैसे प्राप्त करें। दूसरे में कुछ अक्षर परिवर्तित - एक काम पर
प्रयास के आसपास
मैं विभिन्न कार्य करता है जो "प्रयास" मेरी समस्या का समाधान करने के लिए बनाया है। हालांकि, मुझे लगता है कि यह पूरी तरह से ऐसा करने का गलत तरीका है और मुझे चरित्र एन्कोडिंग बदलना चाहिए।
/*
* Converts smart quotes to ascii
*/
function convert_smart_quotes($string) {
$string = iconv("UTF-8", "UTF-32", $string);
$string = mb_convert_encoding($string, 'HTML-ENTITIES', 'UTF-32');
$string = str_replace('', '', $string);
$search = array('‘', '’', '“', '”', '—');
$replace= array("'", "'", '"', '"', '-');
$string = str_replace($search, $replace, $string);
return $string;
}
/*
* Converts some entities to an ISO format?
*
* Example : ° => °
*/
function entity_to_iso($string) {
return html_entity_decode($string, ENT_QUOTES & ~ENT_COMPAT, 'ISO-8859-1');
}
आखिरकार, मेरी समस्या इस तथ्य में रहती है कि मुझे अपलोड की गई फ़ाइल के एन्कोडिंग को नहीं पता है। मुझे switch
का विचार था जो पात्रों को कुछ और डेटाबेस और "पीडीएफ अनुकूल" में बदलने का प्रयास करता है। हालांकि, बहुत से गुगलिंग के परिणामस्वरूप कड़वा काम आसपास या सरणी हुई है जो str_replace
एक चीज है। क्या यह वास्तव में समाधान है?
किसी भी सलाह, समाधान या उंगलियों को एक बेहतर दिशा में इंगित किया गया है, सभी सहायक और बहुत सराहना की जाती हैं। धन्यवाद।
हैलो दोस्त, मेरे पास एक समान समस्या है जिसके साथ आप कहीं भी मिलते हैं? – Drakoumel