मैं User_IDs DATETIME, वस्तुओं और अन्य जानकारी के साथ एक DataFrame पर काम कर रहा है, तो निम्न निकालने की तरह होने के बाद ही यह सच मान रखें:पांडा - GroupBy एक DataFrame
User_ID;Latitude;Longitude;Datetime
222583401;41.4020375;2.1478710;2014-07-06 20:49:20
287280509;41.3671346;2.0793115;2013-01-30 09:25:47
329757763;41.5453577;2.1175164;2012-09-25 08:40:59
189757330;41.5844998;2.5621569;2013-10-01 11:55:20
624921653;41.5931846;2.3030671;2013-07-09 20:12:20
414673119;41.5550136;2.0965829;2014-02-24 20:15:30
414673119;41.5550136;2.0975829;2014-02-24 20:16:30
414673119;41.5550136;2.0985829;2014-02-24 20:17:30
मैं के साथ उपयोगकर्ता वर्गीकृत किया गया है:
g = df.groupby(['User_ID','Datetime'])
और उसके बाद कोई एकल datatime वस्तुओं के लिए जाँच:
df = df.groupby('User_ID')['Datetime'].apply(lambda g: len(g)>1)
मैं निम्नलिखित ख प्राप्त कर लिया है ओलियन डेटाफ्रेम:
User_ID
189757330 False
222583401 False
287280509 False
329757763 False
414673119 True
624921653 False
Name: Datetime, dtype: bool
जो मेरे उद्देश्यों के लिए केवल सही है, केवल True_asked मान के साथ User_ID को रखने के लिए ठीक है। अब मैं केवल सही मानों से जुड़े User_ID मानों को रखना चाहता हूं, और उदाहरण के लिए उन्हें pandas.to_csv
के साथ एक नए डेटाफ्रेम पर लिखें। उम्मीद DataFrame एक से अधिक समयदिनाँक वस्तु के साथ ही user_id होते हैं:
User_ID;Latitude;Longitude;Datetime
414673119;41.5550136;2.0965829;2014-02-24 20:15:30
414673119;41.5550136;2.0975829;2014-02-24 20:16:30
414673119;41.5550136;2.0985829;2014-02-24 20:17:30
कैसे मैं हर user_id के लिए बूलियन मूल्यों की पहुँच हो सकती? आपकी तरह की मदद के लिए धन्यवाद।
वाह! धन्यवाद! मास्किंग करने के लिए मैं परिवर्तनीय असाइनमेंट खो रहा था, धन्यवाद! –