में lazy_evaluated डेटा फ्रेम कॉलम बनाने के लिए कैसे करें, मूल डेटा रखने के लिए मेरे पास एक बड़ा डेटाफ्रेम df
है, और बुनियादी डेटा कॉलम द्वारा गणना किए गए व्युत्पन्न डेटा को पकड़ने के लिए कई और कॉलम बनाने की आवश्यकता है।पांडस
मैं ऐसा कर सकते हैं की तरह पांडा में:
df['derivative_col1'] = df['basic_col1'] + df['basic_col2']
df['derivative_col2'] = df['basic_col1'] * df['basic_col2']
....
df['derivative_coln'] = func(list_of_basic_cols)
आदि पांडा की गणना करने और सभी को एक बार सभी व्युत्पन्न स्तंभों के लिए स्मृति आवंटित करेगा।
अब मुझे क्या चाहिए कि आभासी कॉलम की गणना और स्मृति आवंटन को वास्तविक आवश्यकता पल में स्थगित करने के लिए आलसी मूल्यांकन तंत्र होना है। कुछ हद तक के रूप में lazy_eval_columns को परिभाषित: यह अजगर 'उपज' जनरेटर की तरह समय/स्मृति की बचत होगी
df['derivative_col1'] = pandas.lazy_eval(df['basic_col1'] + df['basic_col2'])
df['derivative_col2'] = pandas.lazy_eval(df['basic_col1'] * df['basic_col2'])
, के लिए अगर मैं df['derivative_col2']
आदेश जारी केवल विशिष्ट गणना और स्मृति आवंटन triger।
तो पांडों में lazy_eval()
कैसे करें? किसी भी टिप/विचार/रेफरी स्वागत है।
महान प्रश्न। पता नहीं है कि पांडा की ऐसी चीज है, यद्यपि। विचार मुझे दृश्यों में एसक्यूएल गणना कॉलम याद दिलाता है। –