मेरे पास प्रत्येक वर्ष के लिए पाठ्यक्रम नाम के साथ डेटाफ्रेम है। मैं महीनों में अवधि वर्ष से शुरू 2016.पांडस पिछड़े 12 महीनों तक बढ़ने
from io import StringIO
import pandas as pd
u_cols = ['page_id','web_id']
audit_trail = StringIO('''
year_id | web_id
2012|efg
2013|abc
2014| xyz
2015| pqr
2016| mnp
''')
df11 = pd.read_csv(audit_trail, sep="|", names = u_cols )
मैं कैसे उच्चतम से शुरू एक नया स्तंभ में महीने जोड़ सकता हूँ खोजने की जरूरत है (यानी bfill की तरह नीचे?)
अंतिम डेटा फ्रेम दिखेगा इस तरह ...
u_cols = ['page_id','web_id' , 'months']
audit_trail = StringIO('''
year_id | web_id | months
2012|efg | 60
2013|abc | 48
2014| xyz | 36
2015| pqr | 24
2016| mnp | 12
''')
df12 = pd.read_csv(audit_trail, sep="|", names = u_cols )
जवाब में से कुछ पर विचार नहीं करते वहाँ कई पाठ्यक्रमों हो सकता है। नमूना डेटा अपडेट कर रहा है ...
from io import StringIO
import pandas as pd
u_cols = ['course_name','page_id','web_id']
audit_trail = StringIO('''
course_name| year_id | web_id
a|2012|efg
a|2013|abc
a|2014| xyz
a|2015| pqr
a|2016| mnp
b|2014| xyz
b|2015| pqr
b|2016| mnp
''')
df11 = pd.read_csv(audit_trail, sep="|", names = u_cols )
अच्छा करने के लिए अपने जवाब बदल सकते हैं! मैं सूचकांक की आवश्यकता नहीं 'ट्रांसफॉर्म' के बारे में भूल गया। – piRSquared