मेरे पास एक एचडीएफ 5 फ़ाइल है जिसमें यौगिक तत्वों के एक-आयामी (एन एक्स 1) डेटासेट हैं - वास्तव में यह एक समय श्रृंखला है। डेटा को पहले एचएफडी 5 फ़ाइल में ऑफ़लाइन एकत्रित किया जाता है, और उसके बाद विश्लेषण किया जाता है। विश्लेषण के दौरान अधिकांश डेटा अनिच्छुक हो जाते हैं, और इसके कुछ हिस्सों में दिलचस्प हैं। चूंकि डेटासेट काफी बड़ा हो सकता है, इसलिए दिलचस्प लोगों को रखते हुए, मैं अनिच्छुक तत्वों से छुटकारा पाना चाहता हूं। उदाहरण के लिए, 500-तत्व डेटासेट के तत्व 0-100 और 200-300 और 350-400 रखें, बाकी को डंप करें। पर कैसे?एचडीएफ 5 फ़ाइल से डेटा को हटाने
क्या किसी को यह अनुभव है कि एचडीएफ 5 के साथ इसे कैसे पूरा किया जाए? स्पष्ट रूप से यह कई तरीकों से किया जा सकता है, कम से कम:
- (स्पष्ट समाधान), एक नई ताजा फ़ाइल बनाएं और तत्व द्वारा तत्व, आवश्यक डेटा लिखें। फिर पुरानी फाइल को हटा दें।
- या, पुरानी फ़ाइल में, एक नया ताजा डेटासेट बनाएं, आवश्यक डेटा लिखें, H5Gunlink() का उपयोग करके पुराने डेटासेट को अनलिंक करें, और h5repack के माध्यम से फ़ाइल चलाकर अनधिकृत खाली स्थान से छुटकारा पाएं।
- या, प्रारंभिक दिशा में मौजूदा डेटासेट के भीतर दिलचस्प तत्वों को स्थानांतरित करें (उदाहरण के लिए 200-300 पदों को 101-3 और तत्व 350-400 पदों को 202-252 पर ले जाएं)। फिर डेटासेट के आकार को कम करने के लिए H5Dset_extent() को कॉल करें। फिर हो सकता है कि मुक्त स्थान जारी करने के लिए h5repack के माध्यम से चलाएं।
चूंकि अनचाहे तत्व हटा दिए जाने के बावजूद फ़ाइलें काफी बड़ी हो सकती हैं, इसलिए मैं उन्हें फिर से लिखना नहीं चाहूंगा (इसमें काफी समय लगेगा), लेकिन ऐसा लगता है कि वास्तव में खाली स्थान जारी करना आवश्यक है । एचडीएफ 5 विशेषज्ञों से कोई संकेत?
आपके विचारों के लिए धन्यवाद। यह वास्तव में कई तरीकों से किया जा सकता है। उम्मीद है कि वास्तविक विलोपन क्षमताओं को किसी दिन एचडीएफ 5 में जोड़ा जाएगा, इस तरह के आसपास गड़बड़ करने के लिए सामान को हटाने के लिए लगभग हास्यास्पद है ... लेकिन अन्यथा, यह एक अच्छा फ़ाइल प्रारूप है :-) –
हटाना और पैकिंग आसान नहीं है। एचडीएफ 5 एक फाइल सिस्टम की तरह है। यहां तक कि यदि आप ब्लॉक को मुक्त करते हैं, तो उन्हें हटाए जाने के रूप में चिह्नित करते हुए, "लाइव" होने पर फ़ाइल पैक करना कठिन होता है और प्रदर्शन बाधा होती है। आप MacOSX पर एन्क्रिप्टेड फाइल सिस्टम के साथ एक ही समस्या का सामना करते हैं, इसलिए मेरा अनुमान है कि मैं भविष्य में किसी भी समय एचडीएफ 5 स्तर पर आपकी समस्या का समाधान नहीं करूंगा। –
सच है, यह निश्चित रूप से आसान नहीं है, और शायद एचडीएफ 5 डेवलपर्स के लिए प्राथमिक रुचि नहीं है। लेकिन यह निश्चित रूप से संभव होगा - अधिकांश डेटाबेस इसे कर सकते हैं, मुझे लगता है। –