यूआरएल से एक एक्सएमएल फ़ाइल डाउनलोड करने के लिए लिनक्स कर्ल का उपयोग करने की कोशिश कर रहा है।लिनक्स कर्ल utf-8
सुंदर लगता है कि एक्सएमएल UTF-8 में एन्कोड किया गया है,
शक कर्ल -ओ does not को UTF-8 के रूप में सहेजें।
वैसे भी यूटीएफ -8 को कर्ल के साथ बचाने के लिए मजबूर होना है?
सुझाव है, मैं क्या पता चला के लिए धन्यवाद:
क्योंकि एक्सएमएल फ़ीड गतिशील है, नहीं हर समय यह किसी भी utf-8 वर्ण होते हैं। कभी-कभी इसमें पूरी सामग्री में utf-8 वर्ण नहीं होता है, भले ही इसे xml एन्कोडिंग और हेडर सामग्री प्रकार में utf-8 के रूप में सेट किया गया हो: charset = utf-8। जब इसमें कम से कम एक utf-8 वर्ण होता है, तो यह utf-8 के रूप में सहेजा जाएगा।
जब ऐसा होता है, तो कर्ल utf-8 के रूप में डाउनलोड नहीं होता है, जो समझ में आता है क्योंकि कोई utf-8 वर्ण नहीं है, utf-8 के रूप में स्टोर करने की आवश्यकता क्यों है।
यह बहुत मुश्किल है, कुछ वैधकर्ता को यूटीएफ -8 के खिलाफ वैध होना है, इसलिए मुझे अभी भी इसे utf8 पर मजबूर करने के लिए एक समाधान की आवश्यकता है क्योंकि डिफ़ॉल्ट रूप से मेरा सभी xml shld utf8-एन्कोडिंग में होना चाहिए।
आइकनव्यू f iso8859-1 utf-8 का उपयोग करके सुझाए गए प्रयासों को इस मामले के लिए काम नहीं करता है क्योंकि मुझे संदेह है कि यह iso8859-1 में नहीं है।
अभी भी एक बेहतर समाधान की आवश्यकता है।
मैं नहीं मानता कि 'curl' यह क्या हासिल करेगा करने के लिए सभी पर किसी भी संशोधन बनाता है, और यह निश्चित रूप से फिर से एनकोड नहीं है पाठ। – geoffspear
हाय धन्यवाद ... हालांकि मैं फिर से एन्कोड डेटा नहीं देख रहा हूं, बस सोच रहा हूं कि यह utf-8 के रूप में क्यों नहीं सहेज रहा है जबकि सामग्री alr utf-8 – flyclassic
क्या आपको लगता है कि यह utf-8 के रूप में सहेज नहीं रहा है? आप वास्तव में क्या करने की कोशिश कर रहे हैं? – geoffspear