अजगर में HTTP पर टैब-सीमांकित फ़ाइल आयात करने पर कार्य में अजगर से अज्ञात एन्कोडिंग के साथ फ़ाइल आयात कर रहा है।MongoDB
MongoDB में एक पंक्ति के डेटा डालने से पहले, मैं स्लैश को हटाने हूँ, टिक्स और स्ट्रिंग से बोलियां।
जो भी डेटा की एन्कोडिंग है, MongoDB मुझे अपवाद फेंक है:
bson.errors.InvalidStringData: strings in documents must be valid UTF-8
तो के रूप में जल्दी के रूप में मैं कर सकते हैं एक प्रयास में इस समस्या को हल करने के लिए, पढ़ने मेरे द्वारा की गई मैं चाहता हूँ से , यूनिकोड() फ़ंक्शन का उपयोग करके पंक्ति के डेटा को यूनिकोड में रूपांतरित करें। इसके अलावा, मैं पहले पैरामीटर के रूप डिकोड() फ़ंक्शन गुजर "यूनिकोड" कॉल करने की कोशिश की है, लेकिन त्रुटि प्राप्त:,
LookupError: unknown encoding: unicode
वहां से मैं ऐसे स्लैश की जगह के रूप में मेरे स्ट्रिंग जोड़तोड़ कर सकते हैं, टिक्स, और उद्धरण। फिर MongoDB में डेटा डालने से पहले, str.encode ('utf-8') फ़ंक्शन का उपयोग करके इसे यूटीएफ -8 में परिवर्तित करें।
समस्या: जब यूनिकोड में कनवर्ट करने, मैं त्रुटि
UnicodeDecodeError: 'ascii' codec can't decode byte 0x93 in position 1258: ordinal not in range(128)
प्राप्त कर रहा इस त्रुटि के साथ, मैं वास्तव में यकीन है कि जारी रखने के लिए जहां नहीं हूँ। मैं कैसे सफलतापूर्वक अपने एन्कोडिंग जानने के बिना एक फ़ाइल से डेटा आयात करते हैं और सफलतापूर्वक MongoDB, जो UTF-8 की आवश्यकता है में डालें:
मेरा प्रश्न है?
धन्यवाद बहुत!
क्यों इस टैग है "csv" पढ़ने पर विचार? –
लेकिन आपने कहा "HTTP पर एक टैब-सीमांकित फ़ाइल आयात करना" ... "सीएसवी" उसमें फिट कहां है? –