हमारी वेबसाइट में, कुछ मैक उपयोगकर्ताओं को परेशानी होती है जब वे पीडीएफ फाइलों से पाठ को टेक्स्टएरिया (TinyMCE द्वारा नियंत्रित) में कॉपी-पेस्ट करते हैं। सभी accentuated char दूषित हैं, और उदाहरण के लिए e?
é
, i?
î
आदि के लिए बन गए हैं, मैं इस समस्या को विंडोज कंप्यूटर के साथ पुन: उत्पन्न नहीं कर सकता।PHP: यूनिकोड accentuated char और diacritics
जब मैंने किसी फ़ाइल पर टेक्स्टएरिया की सामग्री (डेटाबेस में डालने से पहले) लिखा था, तो मैंने अभी पाया है कि प्रारंभिक é
एक परंपरागत é
(विम पर, नीचे देखें) दिखाई देता है।
:
// the corrupted é - first line of the screenshot
echo bin2hex($char); // display 65cc81
// traditionnal é
echo bin2hex('é'); // display c3a9
एक बहुत खोज के बाद, यहाँ मैं हूं: ऐसा लगता है कि मैक ओएस प्रतियां यूनिकोड दो वर्ण का एक संयोजन के रूप में बल वर्ण: हमारे उदाहरण में, e + ́
। अब तक, डेटाबेस में e?
से बचने के लिए, मुझे दूषित é
को वास्तविक के साथ बदलने का कोई समाधान नहीं मिला।
और मैं थोड़ा हताश हूं।
http://unicode.org/reports/tr15/ – hakre