2013-08-06 28 views
8

में set_index के साथ कार्य करना किसी आयातित CSV फ़ाइल का उपयोग करना, मैं इस तरह DataFrame ...पांडा DataFrame

rdata.set_index(['race_date', 'track_code', 'race_number', 'horse_name']) 

यह वही है DataFrame का एक वर्ग की तरह लग रहा है ... अनुक्रमित

race_date track_code race_number horse_name   work_date work_track 
2007-08-24 BM   8   Count Me Twice  2007-05-31   PLN 
            Count Me Twice  2007-06-09   PLN 
            Count Me Twice  2007-06-16   PLN 
            Count Me Twice  2007-06-23   PLN 
            Count Me Twice  2007-08-05   PLN 
            Judge's Choice  2007-06-07   BM 
            Judge's Choice  2007-06-14   BM 
            Judge's Choice  2007-07-08   BM 
            Judge's Choice  2007-08-18   BM 

'घोड़ा_नाम' कॉलम दिनांक, ट्रैक और दौड़ की तरह समूहीकृत क्यों नहीं किया जा रहा है? शायद यह डिज़ाइन द्वारा है, इस प्रकार मैं इस बड़े डेटाफ्रेम को अपने घोड़े के रूप में 'horse_name' के साथ एक नया डेटाफ्रेम रखने के लिए कैसे जा सकता हूं?

+0

एक बग की तरह दिखता है, बग रिपोर्ट के लिए सही जगह [github पर] है [https://github.com/pydata/pandas/issues) :) अच्छा लगता है! –

+1

यह प्रश्न ऑफ-विषय प्रतीत होता है क्योंकि यह एक बग रिपोर्ट है। –

उत्तर

10

यह एक बग नहीं है। यह ठीक है कि यह कैसे काम करना है।

डेटाफ्रेम को अपने डेटा में प्रत्येक आइटम को दिखाना है। तो यदि सूचकांक में एक स्तर है, तो वह स्तर पूरी तरह से विस्तारित हो जाएगा। यदि इसमें दो स्तर हैं, तो पहले स्तर को समूहीकृत किया जाएगा और दूसरा पेड़ स्तर होने पर पूरी तरह से विस्तारित किया जाएगा, पहले दो को समूहीकृत किया जाएगा और तीसरा विस्तार किया जाएगा, और इसी तरह।

इसलिए यही कारण है कि घोड़े का नाम समूहित नहीं किया गया है।

rdata.set_index(['race_date', 'track_code', 'race_number']) 

या:: आप कैसे DataFrame में सभी आइटम देखने के लिए अगर आप घोड़े नाम :)

द्वारा समूह में भी कार्य करके देखें में सक्षम हो जाएगा

rdata.set_index(['race_date', 'track_code']) 

आप देखेंगे कि डेटाफ्रेम में सभी आइटम देखने में सक्षम होने के लिए, इंडेक्स का अंतिम स्तर हमेशा पूर्ण रूप से विस्तारित होता है।

+0

यह काम किया। धन्यवाद! – TravisVOX

संबंधित मुद्दे