क्या कोई जानता है कि पाइथन में फ़ाइल के एन्कोडिंग को कैसे प्राप्त किया जाए। मुझे पता है कि आप एक विशिष्ट एन्कोडिंग के साथ फ़ाइल खोलने के लिए कोडेक्स मॉड्यूल का उपयोग कर सकते हैं लेकिन आपको इसे पहले से ही जानना होगा।पायथन में फ़ाइल के एन्कोडिंग को कैसे जानें?
import codecs
f = codecs.open("file.txt", "r", "utf-8")
क्या फ़ाइल का उपयोग करने के लिए स्वचालित रूप से एन्कोडिंग का उपयोग करने का कोई तरीका है?
अग्रिम धन्यवाद
संपादित करें: धन्यवाद बहुत ही दिलचस्प answsers के लिए हर कोई। तुम भी http://whatismyencoding.com/ जो chardet पर आधारित है द्वारा रुचि हो सकती है (साइट पर अधिक बोतल अजगर ढांचे द्वारा संचालित है)
बहुत अच्छा विचार है। धन्यवाद। –
मैंने इसे थोड़ा सा सरल बनाया और अनुकूलित किया, केवल एक .decode() को एक कोशिश में छोड़कर - जो कि (1) सफल रूपांतरण, या (2) encoding_guess_list को समाप्त करने के बाद टूट जाता है। अगर अंत असफल रहा, तो मैं 'सख्त' के बजाय 'प्रतिस्थापन' पर सेट त्रुटियों के साथ एक अलग .decode() लागू करता हूं। – JDM