2008-08-19 15 views
22

मुझे वहां कुछ परीक्षण डेटा जनरेटर के बारे में पता है, लेकिन अधिकांश नाम और पता शैली डेटाबेस भरने लगते हैं [मुझे सही करने के लिए स्वतंत्र महसूस करें]।डेटाबेस में परीक्षण डेटा बनाना

हमारे पास एक बड़ा एकीकृत और सामान्यीकृत अनुप्रयोग है - उदा। इनवॉइस में स्टॉकिंग टेबल से जुड़े भाग संख्याएं होती हैं, ग्राहक तालिका से जुड़े ग्राहक संख्याएं, ऑडिट जानकारी से जुड़े लॉग बदलती हैं, जो यादृच्छिक रूप से भरना मुश्किल है। वर्तमान में हम परीक्षण डेटा प्राप्त करने के लिए वास्तविक जीवन डेटा को खराब कर देते हैं (लेकिन बहुत अच्छी तरह से नहीं)।

परीक्षण के लिए डेटा की बड़ी मात्रा बनाने के लिए आप किन टूल्स \ विधियों का उपयोग करते हैं?

उत्तर

7

जहां मैं काम करता हूं हम परीक्षण डेटा उत्पन्न करने के लिए RedGate Data Generator का उपयोग करते हैं।

चूंकि हम बैंकिंग डोमेन में काम करते हैं। जब हमें नामांकित डेटा (क्रेडिट कार्ड नंबर, व्यक्तिगत आईडी, फोन नंबर) के साथ काम करना होता है तो हमने एक एप्लीकेशन विकसित किया है जो मास्क इन डेटाबेस फ़ील्ड्स को कर सकता है ताकि हम उनके साथ वास्तविक डेटा के रूप में काम कर सकें।

मैं रेडगेट के साथ कह सकता हूं कि आप अपने वास्तविक डेटा को उत्पादन सर्वर पर कैसा दिख सकते हैं क्योंकि आप अपने बीडी में प्रत्येक तालिका के प्रत्येक फ़ील्ड को कस्टमाइज़ कर सकते हैं।

1

लाल गेट उत्पाद अच्छा है में Redgate उल्लेख किया ... लेकिन सही नहीं।

मैंने पाया कि जब मैंने डेटा उत्पन्न करने के लिए अपने स्वयं के टूल्स लिखे थे तो मैंने बेहतर प्रदर्शन किया था। जब मैं ग्राहकों को उत्पन्न करना चाहता हूं तो मैं इसका उपयोग करता हूं ... लेकिन अगर आप यादृच्छिकता को अनुकरण करना चाहते हैं तो यह बहुत अच्छा नहीं है कि ग्राहक ऑर्डर बनाने की तरह व्यस्त हो सकते हैं ... कुछ एक आइटम के साथ कई आइटम हैं।

गृहगणित उपकरण मुझे लगता है कि 'यथार्थवादी' डेटा प्रदान करेगा।

+0

हमारे परीक्षण डेटा जनरेटर उपकरण, "उन्नत डेटा जनरेटर" यथार्थवादी डेटा उत्पन्न करता है: कंपनी के नाम, अंतिम और पहले नाम, ई-मेल पते, सड़क के नाम, शहर के नाम और बहुत कुछ। देखें http://www.upscene.com/go/?go=adg –

3

आप वीएसटीएस डाटाबेस संस्करण (नवीनतम 2008 पावर टूल्स के साथ) के साथ डेटा प्लान जेनरेट कर सकते हैं।

यह एक डाटा जनरेशन जादूगर जो एक मौजूदा डेटाबेस की ओर इशारा करते हैं ताकि आप कुछ है कि यथार्थवादी है, लेकिन पूरी तरह से अलग डेटा

2

मैं सिर्फ एक परियोजना बनाने 3,500,000+ स्वास्थ्य बीमा दावा लाइनों पूरा होता है प्राप्त द्वारा स्वचालित डेटा पीढ़ी की अनुमति देता है शामिल है। एचआईपीपीए और पीएचआई प्रतिबंधों के कारण, यहां तक ​​कि वास्तविक डेटा का उपयोग करके एक पिटा है। मैंने इस के लिए डेटाटेक्ट नामक एक उपकरण का उपयोग किया (http://www.datatect.com/)।

चीजें मैं इस उपकरण के बारे तरह से कुछ:

  1. का उपयोग करता है ODBC तो आप किसी भी ODBC डेटा स्रोत में डेटा उत्पन्न कर सकते हैं। मैंने ओरेकल, एसक्यूएल और एमएस एक्सेस डेटाबेस, फ्लैट फाइलों और एक्सेल स्प्रैडशीट्स के लिए इसका इस्तेमाल किया है।
  2. वीबीस्क्रिप्ट के माध्यम से एक्स्टेंसिबल। टूल की क्षमताओं का विस्तार करने के लिए आप डेटा पीढ़ी वर्कफ़्लो के विभिन्न हिस्सों पर हुक लिख सकते हैं। मैंने इस सुविधा का उपयोग डेटाबेस में निर्भर कॉलम को "सिंक अप" करने के लिए किया था, और वास्तविक दुनिया के आवृत्तियों के साथ संरेखित करने के लिए मानों की आवृत्ति वितरण को नियंत्रित करने के लिए किया था।
  3. संदर्भित रूप से जागरूक। विदेशी कुंजी कॉलम पॉप्युलेट करते समय, मूल तालिका से मान्य कुंजी खींचती है।
3

मैंने अपना खुद का डेटा जनरेटर लॉन्च किया है जो नियमित अभिव्यक्तियों के अनुरूप यादृच्छिक डेटा उत्पन्न करता है। बुनियादी विचार दो बार प्रमाणीकरण नियमों का उपयोग करना है।सबसे पहले आप उन्हें वैध यादृच्छिक डेटा उत्पन्न करने के लिए उपयोग करते हैं और फिर आप उत्पादन में नए इनपुट को सत्यापित करने के लिए उनका उपयोग करते हैं। मैंने उपयोगिता की एक पुनर्लेखन कहा है क्योंकि यह एक अच्छी शिक्षा परियोजना की तरह लगता है। यह googlecode पर उपलब्ध है।

संबंधित मुद्दे