बड़े डेटा सेटों का परीक्षण करने का सबसे अच्छा तरीका क्या है? कुछ विरासत कोड जो मैं रख रहा हूं उनमें सौ सदस्यों या अधिक की संरचनाएं हैं; कोड के अन्य हिस्सों जिन्हें हम सैकड़ों नमूनों के डेटा सेट बनाने या विश्लेषण करने पर काम कर रहे हैं।यूनिट परीक्षण बड़े डेटा सेट?
अब तक का सबसे अच्छा तरीका डिस्क से संरचनाओं या डेटा सेटों को क्रमबद्ध करने, परीक्षण के तहत संचालन करने, डिस्क को परिणामों को क्रमबद्ध करने के लिए, फिर अपेक्षित परिणामों वाली फ़ाइलों के विरुद्ध क्रमबद्ध परिणामों वाली फ़ाइलों को अलग करना है। यह बहुत तेजी से नहीं है, और यह यूनिट परीक्षण के "डिस्क को स्पर्श न करें" सिद्धांत का उल्लंघन करता है। हालांकि, एकमात्र विकल्प मैं सोच सकता हूं (सैकड़ों सदस्यों और डेटा बिंदुओं को शुरू करने और परीक्षण करने के लिए कोड लिखना) असहनीय रूप से थकाऊ लगता है।
क्या कोई बेहतर समाधान है?
यदि आप डेटा का परीक्षण कर रहे हैं, तो मुझे लगता है कि आपको डिस्क को छूना है। – MrBoJangles
यदि आप डेटा को नकली बना सकते हैं, तो आप इसे स्मृति में बना सकते हैं - लेकिन यदि यह वास्तविक डेटा है जिसे आप परीक्षण करना चाहते हैं, तो आपको इसे डिस्क से पढ़ना होगा। मुझे नहीं पता कि आप किस प्रकार का डेटा वर्णन कर रहे हैं, लेकिन आप इसे एक टेक्स्ट फ़ाइल में पढ़ सकते हैं और इसे अपने कोड, स्मृति में, शायद संकलित कर सकते हैं। – pc1oad1etter