मेरे पास ऐसा टेक्स्टफाइल में एक डेटासेट है जो इस तरह दिखता है।पांडस का उपयोग करके एक टेक्स्ट फ़ाइल पढ़ना जहां कुछ पंक्तियों में खाली तत्व हैं?
0 0CF00400 X 8 66 7D 91 6E 22 03 0F 7D 0.021650 R
0 18EA0080 X 3 E9 FE 00 0.022550 R
0 00000003 X 8 D5 64 22 E1 FF FF FF F0 0.023120 R
मैं इस का उपयोग कर
file_pandas = pd.read_csv(fileName, delim_whitespace = True, header = None, engine = 'python')
पढ़ा और उत्पादन
0 0 0CF00400 X 8 66 7D 91 6E 22 03 0F 7D 0.02165
1 0 18EA0080 X 3 E9 FE 0 0.022550 R None None None NaN
2 0 00000003 X 8 D5 64 22 E1 FF FF FF F0 0.02312
मिला लेकिन मैं इस
0 0 0CF00400 X 8 66 7D 91 6E 22 03 0F 7D 0.021650 R
1 0 18EA0080 X 3 E9 FE 00 0.022550 R
2 0 00000003 X 8 D5 64 22 E1 FF FF FF F0 0.023120 R
के रूप में पढ़ा मैं delim_whitespace = True
को दूर करने और जगह की कोशिश की है चाहता हूँ यहके साथलेकिन यह ऊपर दिखाए गए आउटपुट में पहले चार कॉलम को जोड़ता है, लेकिन यह बाकी डेटा को सही तरीके से पार्स करता है, जिसका अर्थ है कि शेष कॉलम मूल txt फ़ाइल (व्हाइट्स स्पेस में NaN मानों को छोड़कर) की तरह थे।
मुझे यकीन नहीं है कि यहां से कैसे आगे बढ़ना है।
साइड नोट: 00
को केवल 0
के रूप में पार्स किया जा रहा है। क्या इसके बजाय 00
प्रदर्शित करने का कोई तरीका है?
यह एक निश्चित चौड़ाई फ़ाइल की तरह लग रहा है, तो आप कोशिश कर सकते हैं 'read_fwf' भी आप टैब की क्या ज़रूरत है या यहाँ जगहें? '00' को संरक्षित करने के लिए आपको 'dtype = np.object' – EdChum