2015-05-26 6 views
16

मैं पांडस में डेटाफ्रेम में एक CSV फ़ाइल पढ़ने का प्रयास कर रहा हूं।पांडा में एन्कोडिंग त्रुटि read_csv

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x96 in position 55: invalid start byte

इस कोड से है:: जब मैं, मैं निम्नलिखित त्रुटि मिलती है करने की कोशिश

import pandas as pd 

location = r"C:\Users\khtad\Documents\test.csv" 

df = pd.read_csv(location, header=0, quotechar='"') 

यह एक विंडोज 7 एंटरप्राइज सर्विस पैक 1 मशीन पर है और यह हर को लागू करने के लिए लगता है सीएसवी फ़ाइल मैं बनाते हैं। इस विशेष मामले में स्थान 55 से बाइनरी 00101001 है और यदि यह महत्वपूर्ण है तो स्थान 54 01110011 है।

फ़ाइल संपादक के साथ फ़ाइल को यूटीएफ -8 के रूप में सहेजना, या तो मदद नहीं करता है। इसी तरह, परम "एन्कोडिंग = 'utf-8' काम नहीं करता, को जोड़ने या तो - यह एक ही त्रुटि देता है

क्या इस त्रुटि का सबसे संभावित कारण है और वहाँ किसी भी DataFrame छोड़ने के अलावा अन्य कामकाज से जुड़े हैं। पल के लिए निर्माण और सीएसवी मॉड्यूल का उपयोग कर सीएसवी पंक्ति-दर-पंक्ति में पढ़ने के लिए

+2

क्या आपने 'read_csv'' पर param 'encoding = 'utf-8'' पास करने का प्रयास किया है? – EdChum

+1

या आपने फाइल के साथ कोई समस्या है या नहीं, यह जांचने के लिए सीएसवी मॉड्यूल का उपयोग कर फ़ाइल पढ़ने की कोशिश की है? – Alexander

+0

@Alexander मैंने सफलतापूर्वक फाइल को सीएसवी मॉड्यूल के साथ पढ़ा, हां। – khtad

उत्तर

39

encoding='latin1', encoding='iso-8859-1' या encoding='cp1252' साथ read_csv कॉल करके देखें;? विंडोज पर पाया इन विभिन्न एन्कोडिंग

+0

समृद्ध है, मैं इन सभी 3 एन्कोडिंग का सफलतापूर्वक उपयोग करने में सक्षम था। – Smitty

1

यह मैक में काम करता है। साथ ही आप

का उपयोग कर सकते हैं

संबंधित मुद्दे