मैं pandas.read_csv का उपयोग कर अनुपलब्ध मानों के साथ .txt पढ़ने की कोशिश करता हूं। मेरा डेटा प्रारूप का है:पाइथन पांडा में लापता मूल्यों के साथ फ़ाइल पढ़ने
10/08/2012,12:10:10,name1,0.81,4.02,50;18.5701400N,4;07.7693770E,7.92,10.50,0.0106,4.30,0.0301
10/08/2012,12:10:11,name2,,,,,10.87,1.40,0.0099,9.70,0.0686
बिंदुओं, जीपीएस स्थिति और अन्य रीडिंग के समान नाम वाले हजारों नमूनों के साथ। मैं एक कोड का उपयोग करें:
myData = read_csv('~/data.txt', sep=',', na_values='')
कोड na_values के रूप में गलत है NaN या अन्य सूचक देता नहीं है। कॉलम का आकार समान होना चाहिए लेकिन मैं अलग-अलग लंबाई के साथ समाप्त होता हूं।
मुझे नहीं पता कि na_values के बाद वास्तव में क्या टाइप किया जाना चाहिए (सभी अलग-अलग चीजों को आजमाएं)। धन्यवाद
यदि आप 'skiprows = 1' हैं, तो फ़ाइल में एक पंक्ति है। उस पैरामीटर के बिना मैं डेटाफ्रेम में स्पष्ट 'NaN' देखता हूं। – eumiro
मैंने अपना प्रारूप दिखाने के लिए अपने डेटा की केवल दो पंक्तियां पोस्ट की हैं। skiprows = 1 अनुपलब्ध डेटा के साथ कुछ भी नहीं करता है, मूल फ़ाइल में 15000 लाइनें होती हैं और पहली पंक्तियों में कुछ नाम शामिल होते हैं, जो मैं नहीं चाहता हूं। – tomasz74
मैंने स्पष्टता के लिए 'skiprows = 1' हटा दिया – tomasz74