मेरे पास एक बड़ी एचडीएफ 5 फ़ाइल है, मैं कुछ संचालन करने के लिए एक पांडा डेटाफ्रेम में इसका हिस्सा लोड करना चाहता हूं, लेकिन मुझे कुछ पंक्तियों को फ़िल्टर करने में दिलचस्पी है।शर्तों के साथ pdas डेटाफ्रेम को एचडीएफ 5 फ़ाइल पढ़ें
मैं एक उदाहरण के साथ बेहतर व्याख्या कर सकते हैं:
मूल HDF5 फ़ाइल कुछ ऐसा दिखाई देगा:
A B C D
1 0 34 11
2 0 32 15
3 1 35 22
4 1 34 15
5 1 31 9
1 0 34 15
2 1 29 11
3 0 34 15
4 1 12 14
5 0 34 15
1 0 32 13
2 1 34 15
etc etc etc etc
मुझे क्या करना कोशिश कर रहा हूँ इस लोड करने के लिए, इसी रूप में काम, एक पांडा के लिए Dataframe लेकिन केवल where A==1 or 3 or 4
अब तक मैं सिर्फ का उपयोग कर पूरे HDF5 लोड कर सकते हैं:
store = pd.HDFStore('Resutls2015_10_21.h5')
df = pd.DataFrame(store['results_table'])
मुझे नहीं लगता कि यहां where
स्थिति कैसे शामिल करें।
धन्यवाद unutbu, इस अच्छे उत्तर पर कुछ टिप्पणियां। मैं समझता हूं कि, आपके उत्तर की शुरुआत में आप डीएफ को तालिका प्रारूप में एच 5 लिखते हैं। हालांकि, मेरी स्क्रिप्ट में इनपुट एक एच 5 पहले ही सहेजा गया है, मैं कैसे जान सकता हूं कि यह सही प्रारूप में है या नहीं? – codeKiller
यदि आपकी 'h5' फ़ाइल' table' प्रारूप में नहीं है, तो 'pd.read_hdf' का उपयोग करके 'कहाँ' पैरामीटर बढ़ाएगा 'TypeError: एक निश्चित प्रारूप से पढ़ते समय कहां विनिर्देश पास नहीं कर सकता ...'। यदि 'h5' फ़ाइल 'ए'' द्वारा 'तालिका' प्रारूप में है, तो 'data_column' के रूप में निर्दिष्ट नहीं किया गया था, तो आपको' ValueError: पास किया गया जहां अभिव्यक्ति: ए [1,3,4] में एक अवैध चर शामिल है संदर्भ ... '। – unutbu
मुझे एक एच 5 फ़ाइल को 'निश्चित' से' तालिका' प्रारूप में बदलने या 'data_columns' जोड़ने के लिए त्वरित/आसान तरीका नहीं पता है। जहां तक मुझे पता है, आपको संपूर्ण 'h5' फ़ाइल को डेटाफ्रेम में पढ़ना होगा (या' chunksize' पैरामीटर का उपयोग करके भाग में ऐसा करने के लिए) और फिर इसे लिखने या एक अलग 'h5' फ़ाइल में जोड़ने के लिए 'टेबल' प्रारूप। – unutbu