मेरे एक मित्र को बहुत सारे डेटा (लगभग 18000 डेटा सेट) पढ़ने की आवश्यकता है जो सभी को परेशान रूप से स्वरूपित किया गया है। विशेष रूप से डेटा को डेटा के 8 कॉलम और ~ 8000 पंक्तियां माना जाता है, लेकिन इसके बजाय डेटा को अगली पंक्ति के पहले कॉलम में अंतिम प्रविष्टि के साथ 7 के कॉलम के रूप में वितरित किया जाता है।पायथन: कॉलम की असमान संख्या के साथ डेटा फ़ाइल को कैसे पढ़ा जाए
इसके अलावा प्रत्येक ~ 30 पंक्तियों में केवल 4 कॉलम हैं। ऐसा इसलिए है क्योंकि कुछ अपस्ट्रीम प्रोग्राम 7x8120 सरणी में 200 x 280 सरणी को दोबारा बदल रहा है।
मेरा प्रश्न यह है: हम डेटा को 8x7000 सरणी में कैसे पढ़ सकते हैं। असमान संख्या में कॉलम होने पर np.loadtxt और np.genfromtxt का मेरा सामान्य शस्त्रागार विफल रहता है।
ध्यान रखें कि प्रदर्शन एक कारक है क्योंकि इसे ~ 18000 डेटाफाइल के लिए किया जाना है। http://users-phys.au.dk/hha07/hk_L1.ref
स्पष्टीकरण के लिए: प्रत्येक 24 पंक्तियों में प्रत्येक कॉलम में आठ कॉलम के निरंतर "बहने" की वजह से 4 कॉलम पंक्ति होती है। सही? 24 * 7 + 4 के प्रत्येक ब्लॉक में 200 आइटम होते हैं, जो समान रूप से विभाजित होते हैं 8. –
एक उदाहरण बहुत उपयोगी होगा। –
अच्छी HDF5 फ़ाइलों को आउटपुट करने के लिए अपस्ट्रीम प्रोग्राम को ठीक करने के बारे में, या कम से कम कुछ कम पागल? –