मेरे डेटा में किसी निश्चित तिथि पर एक से अधिक घटनाओं को डेट पर कोई ईवेंट नहीं है सकते हैं। मैं इन घटनाओं को लेता हूं, तिथि से गिनती करता हूं और उन्हें साजिश देता हूं। हालांकि, जब मैं उन्हें साजिश करता हूं, तो मेरी दो श्रृंखला हमेशा मेल नहीं खाती हैं।जोड़ें लापता दिनांकों dataframe
idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max())
s = df.groupby(['simpleDate']).size()
ऊपर कोड IDX में 30 दिनांकों कहना की एक श्रृंखला बन जाता है। क्योंकि कोई घटनाओं किसी निश्चित तिथि के लिए हुआ 2013/09/01 2013/09/30 के लिए हालांकि एस केवल 25 या 26 दिन हो सकता है। मैं तो एक AssertionError मिल के रूप में आकार न मैच जब मैं साजिश करने का प्रयास करें:
fig, ax = plt.subplots()
ax.bar(idx.to_pydatetime(), s, color='green')
इस से निपटने के लिए उचित तरीका क्या है? मैं IDX या (जो मैं नहीं बल्कि करना चाहते हैं) की ओर से कोई मूल्यों के साथ दिनांक निकालना चाहते श्रृंखला के लिए 0 मूल्यों के साथ 0. की गणना के साथ लापता तिथि जोड़ते है मैं नहीं बल्कि 30 दिनों की एक पूरी ग्राफ होगा है । यदि यह दृष्टिकोण सही है, तो कैसे शुरू किया जाए इस पर कोई सुझाव? क्या मुझे कुछ प्रकार की गतिशील reindex
फ़ंक्शन चाहिए?
यहाँ एस (df.groupby(['simpleDate']).size()
) का एक टुकड़ा है, 04 के लिए कोई प्रविष्टि नहीं नोटिस और 05.
09-02-2013 2
09-03-2013 10
09-06-2013 5
09-07-2013 1
वाह धन्यवाद! मैं पूरी तरह से समझ नहीं पाया कि रीइंडेक्स कितनी अच्छी तरह से काम करता है। – KHibma
'रीइन्डेक्स' एक अद्भुत कार्य है। यह (1) लेबल के नए सेट से मेल खाने के लिए मौजूदा डेटा को पुन: व्यवस्थित कर सकता है, (2) नई पंक्तियां डालें जहां पहले कोई लेबल मौजूद नहीं था, (3) गायब लेबल के लिए डेटा भरें, (आगे/पीछे भरने सहित) (4) पंक्तियों का चयन करें लेबल द्वारा! – unutbu
@unutbu यह एक प्रश्न का हिस्सा है जो मैंने भी किया था, धन्यवाद! लेकिन यह सोच रहा था कि क्या आपको पता था कि घटनाओं के साथ तारीखों की सूची कैसे गतिशील रूप से बनाई जाए? –