मेरे पास एक पांडा डेटाफ्रेम में एक कॉलम है जिसे मैं एक ही स्थान पर विभाजित करना चाहता हूं। विभाजन DataFrame.str.split(' ')
के साथ काफी आसान है, लेकिन मैं अंतिम प्रविष्टि से एक नया कॉलम नहीं बना सकता। जब मैं .str.split()
कॉलम मुझे सरणी की एक सूची प्राप्त करता है और मुझे नहीं पता कि मेरे डेटाफ्रेम के लिए नया कॉलम प्राप्त करने के लिए इसे कैसे उपयोग किया जाए।पांडा में कॉलम पर .str.split() ऑपरेशन के बाद अंतिम "कॉलम" प्राप्त करें डेटाफ्रेम
यहां एक उदाहरण है। कॉलम में प्रत्येक प्रविष्टि में 'प्रतीक डेटा मूल्य' होता है और मैं कीमत को विभाजित करना चाहता हूं (और अंत में "पी" ... या "सी" को आधे मामलों में हटा दें)।
import pandas as pd
temp = pd.DataFrame({'ticker' : ['spx 5/25/2001 p500', 'spx 5/25/2001 p600', 'spx 5/25/2001 p700']})
temp2 = temp.ticker.str.split(' ')
जो पैदावार
0 ['spx', '5/25/2001', 'p500']
1 ['spx', '5/25/2001', 'p600']
2 ['spx', '5/25/2001', 'p700']
लेकिन temp2[0]
सिर्फ एक सूची प्रविष्टि के सरणी देता है और temp2[:][-1]
विफल रहता है। मैं प्रत्येक सरणी में अंतिम प्रविष्टि को नए कॉलम में कैसे परिवर्तित कर सकता हूं? धन्यवाद!
यह सिर्फ मुझे पांडा में एक लॉग फ़ाइल जोड़ने में मदद करता है जो बहुत डरावना और गन्दा था (प्रति पंक्ति बहुत सारी जानकारी वाले डेटा के एकल कॉलम)। – trench
वेस मैककिनी के जवाब की तुलना में इन सभी दृष्टिकोणों में विनाशकारी प्रदर्शन है। –
@ जोहानज़विन: वाह, कार्यक्षमता के बारे में पांच वर्षीय उत्तर पर एक प्रदर्शन-केवल संबंधित डाउनवोट जिसे केवल [दो महीने पहले] के बारे में पेश किया गया था (https://github.com/pandas-dev/pandas/issues/1656)? वह है .. कठोर, मैं तुम्हें वह दूंगा! – DSM