2014-06-16 8 views
5

से निपटने का पुन: नमूना मैं मासिक डेटा से निपटने के लिए पांडा का उपयोग कर रहा हूं जिसमें कुछ गुम मूल्य है। मैं वार्षिक आंकड़ों की गणना करने के लिए अनुकरण विधि का उपयोग करने में सक्षम होना चाहता हूं लेकिन बिना किसी गुम डेटा वाले वर्षों के लिए।लैंडस लापता डेटा

import pandas as pd 
import numpy as np 
dates = pd.date_range(start = '1980-01', periods = 24,freq='M') 
df = pd.DataFrame([np.nan] * 10 + range(14), index = dates) 

यहाँ मैं क्या प्राप्त है अगर मैं resample:

In [18]: df.resample('A') 
Out[18]: 
      0 
1980-12-31 0.5 
1981-12-31 7.5 

मैं 1980-1912 के लिए एक np.nan करना चाहते हैं

यहाँ प्रदर्शित करने के लिए कुछ कोड और उत्पादन है -31 इंडेक्स के बाद से उस महीने मासिक मूल्य नहीं है। मैंने 'कैसे' तर्क के साथ खेलने की कोशिश की लेकिन कोई किस्मत नहीं।

मैं इसे कैसे पूरा कर सकता हूं?

उत्तर

2

मैं वहाँ एक बेहतर तरीका है यकीन है, लेकिन इस मामले में आप का उपयोग कर सकते हैं:

df.resample('A', how=[np.mean, pd.Series.count, len]) 

और उसके बाद सभी पंक्तियों जहां count != len

+0

मैं इस पर गौर करेंगे छोड़ देते हैं। धन्यवाद। – sbiner

संबंधित मुद्दे