का उपयोग कर सीएसवी को mongoimport- अनुकूल JSON में कनवर्ट करें मेरे पास 300 एमबी सीएसवी है जिसमें Geonames.org से 3 मिलियन पंक्तियों की शहर की जानकारी है। मैं mongoimport के साथ MongoDB में आयात करने के लिए इस सीएसवी को जेएसओएन में बदलने की कोशिश कर रहा हूं। जिस कारण से मैं JSON चाहता हूं वह यह है कि यह मुझे "लोक" फ़ील्ड को सरणी के रूप में निर्दिष्ट करने की अनुमति देता है और geospatial अनुक्रमणिका के साथ उपयोग के लिए एक स्ट्रिंग नहीं है। सीएसवी यूटीएफ -8 में एन्कोड किया गया है।पाइथन
"geonameid","name","asciiname","alternatenames","loc","feature_class","feature_code","country_code","cc2","admin1_code","admin2_code","admin3_code","admin4_code"
3,"Zamīn Sūkhteh","Zamin Sukhteh","Zamin Sukhteh,Zamīn Sūkhteh","[48.91667,32.48333]","P","PPL","IR",,"15",,,
5,"Yekāhī","Yekahi","Yekahi,Yekāhī","[48.9,32.5]","P","PPL","IR",,"15",,,
7,"Tarvīḩ ‘Adāī","Tarvih `Adai","Tarvih `Adai,Tarvīḩ ‘Adāī","[48.2,32.1]","P","PPL","IR",,"15",,,
वांछित JSON निर्गम (चारसेट को छोड़कर) कि mongoimport साथ काम करता है नीचे है::
{"geonameid":3,"name":"Zamin Sukhteh","asciiname":"Zamin Sukhteh","alternatenames":"Zamin Sukhteh,Zamin Sukhteh","loc":[48.91667,32.48333] ,"feature_class":"P","feature_code":"PPL","country_code":"IR","cc2":null,"admin1_code":15,"admin2_code":null,"admin3_code":null,"admin4_code":null}
{"geonameid":5,"name":"Yekahi","asciiname":"Yekahi","alternatenames":"Yekahi,Yekahi","loc":[48.9,32.5] ,"feature_class":"P","feature_code":"PPL","country_code":"IR","cc2":null,"admin1_code":15,"admin2_code":null,"admin3_code":null,"admin4_code":null}
{"geonameid":7,"name":"Tarvi? ‘Adai","asciiname":"Tarvih `Adai","alternatenames":"Tarvih `Adai,Tarvi? ‘Adai","loc":[48.2,32.1] ,"feature_class":"P","feature_code":"PPL","country_code":"IR","cc2":null,"admin1_code":15,"admin2_code":null,"admin3_code":null,"admin4_code":null}
मैं सभी उपलब्ध ऑनलाइन सीएसवी की कोशिश की है
मेरी सीएसवी का एक स्निपेट इस तरह दिखता है -जॉन कनवर्टर्स और वे फ़ाइल आकार के कारण काम नहीं करते हैं। मुझे सबसे नज़दीकी मिला Mr Data Converter (उपरोक्त चित्रित) के साथ था जो दस्तावेज़ों के बीच प्रारंभ और अंत ब्रैकेट और कॉमा को हटाने के बाद मोंगो डीबी में आयात करेगा। दुर्भाग्यवश यह उपकरण 300 एमबी फ़ाइल के साथ काम नहीं करता है।
उपरोक्त JSON यूटीएफ -8 में एन्कोड किया गया है लेकिन अभी भी एक त्रुटि त्रुटि के कारण वर्णमाला की समस्याएं हैं?
मैंने पिछले तीन दिनों में पाइथन सीखने का प्रयास किया, पाइथन सीएसवीकेआईटी का उपयोग करने की कोशिश की, स्टैक ओवरफ्लो पर सभी सीएसवी-जेएसओएन स्क्रिप्ट का प्रयास किया, मोंगोडीबी को सीएसवी आयात किया और सरणी में "लोक" स्ट्रिंग को बदल दिया (यह दुर्भाग्यवश उद्धरण चिह्नों को बरकरार रखता है) और एक समय में 30,000 रिकॉर्ड मैन्युअल रूप से कॉपी और पेस्ट करने का भी प्रयास कर रहे हैं। बहुत सारे रिवर्स इंजीनियरिंग, परीक्षण और त्रुटि और बहुत आगे।
क्या किसी के पास सीएसवी में उचित एन्कोडिंग को उचित रखते हुए उपरोक्त JSON को प्राप्त करने का संकेत है? मैं पूरी तरह से स्थिर हूं।
संभावित डुप्लिकेट का उपयोग कर सीएसवी MongoDB में सीधे आयात करने की कोशिश कर सकते: http://stackoverflow.com/questions/1884395/csv-to-json-script – xiaoyi
मेरा प्रश्न के संबंध में है स्वरूपण और त्रुटि संदेश नहीं। मुझे कोई त्रुटि नहीं मिल रही है, न तो वांछित आउटपुट। – Karl
यह प्रश्न डुप्लिकेट नहीं है: उपरोक्त संदर्भित अन्य प्रश्न में मौजूद एन्कोडिंग समस्याएं और विशेष आउटपुट प्रारूप आवश्यकताएं मौजूद नहीं हैं। – Petri