के साथ स्ट्रिंग से बीओएम निकालें मुझे निम्नलिखित समस्या है: मैं एक यूटीएफ -8 टेक्स्ट फ़ाइल से पढ़ रहा हूं (और मैं पर्ल को बता रहा हूं कि मैं ऐसा कर रहा हूं ": एन्कोडिंग (utf-8)")। 43 6F 6E 66 65 72 65 6E 63 65पर्ल
यह जब मुद्रित "∩╗┐Conference" करने के लिए अनुवाद एफई बी बी बीएफ:
फ़ाइल इस तरह एक हेक्स दर्शक में लग रहा है। मैं "विस्तृत चरित्र" को समझता हूं जिसे मुझे बीओएम के बारे में चेतावनी दी जा रही है। मैं इससे छुटकारा पाना चाहता हूं (चेतावनी के कारण नहीं, बल्कि क्योंकि यह बाद में एक स्ट्रिंग तुलना को गड़बड़ कर देता है)।
तो मैं निम्नलिखित कोड का उपयोग कर इसे हटाने के लिए कोशिश की, लेकिन मैं बुरी तरह असफल:
$ लाइन = ~ s/^ \ XEF \ xbb \ xBF //;
क्या कोई मुझे यूटीएफ -8 बीओएम को एक स्ट्रिंग से हटाने के तरीके के बारे में बता सकता है जिसे मैंने यूटीएफ -8 फ़ाइल की पहली पंक्ति पढ़कर प्राप्त किया था?
धन्यवाद!
आप आउटपुट एन्कोडिंग सही रूप से निर्धारित बीओएम दूर करने के लिए कोई ज़रूरत नहीं होना चाहिए के रूप में है, क्योंकि एक शून्य चौड़ाई स्थान होगा जब तक शॉर्टंड का उपयोग करने के लिए परिणाम – Borodin