2011-05-31 10 views
15

क्या किसी को ऐसे टूल के बारे में पता है जो निर्दिष्ट स्कीमा का निरीक्षण कर सकता है और उस स्कीमा के टेबल और कॉलम के आधार पर यादृच्छिक डेटा उत्पन्न कर सकता है?मैं अपने ओरेकल डेटाबेस में यादृच्छिक नमूना डेटा कैसे उत्पन्न करूं?

+0

+1, अच्छा सवाल, बावजूद बंद करने के लिए वोट (उदाहरण के आदेश और उत्पादों की एक यादृच्छिक संयोजन के लिए आदेश लाइनों पैदा करने के लिए); -) वास्तव में, अच्छी जानकारी के लिए चारों ओर ऊपर उठाता है। – DCookie

उत्तर

3

ऑलराउंड ऑटोमेशन PL/SQL Developer में डेटा जेनरेटर टूल है। लेकिन चेतावनी दी जानी चाहिए: यह थोड़ी चंचल है - ऐसा लगता है कि यह एकल-टेबल आधार पर ठीक काम करता है लेकिन टेबल के बीच निर्भरता होने पर ट्रिप हो जाता है।

मैं मानता हूं कि आखिरकार मैंने डेटा उत्पन्न करने के लिए अपनी खुद की एसक्यूएल स्क्रिप्ट लिखना शुरू कर दिया। अधिक स्थिर होने के लिए बाहर निकला।

2

एक जंगली कार्ड का बिट यह सोचा लेकिन मैंने सोचा कि मैं इसका उल्लेख करूंगा।

यदि आपके पास ऐसे उत्पादन वातावरण में डेटा है जिसका आप उपयोग नहीं कर सकते हैं क्योंकि इसमें संवेदनशील जानकारी हो सकती है, ओरेकल के पास "ओरेकल डेटा मास्किंग" नामक एक उत्पाद है जो संवेदनशील जानकारी को यथार्थवादी मूल्यों से प्रतिस्थापित करेगा।

मुझे इस उत्पाद की लागत नहीं पता है, लेकिन यदि आप अधिक जानकारी चाहते हैं, तो यह here पाया जा सकता है।

+0

डेटा मास्किंग एंटरप्राइज़ संस्करण के लिए एक चार्ज करने योग्य अतिरिक्त है यानी बहुत महंगा है। – APC

3

Databene Benerator पर एक नज़र डालें।

प्रारंभिक सेटअप करने के लिए यह थोड़ा जटिल है लेकिन यह काफी शक्तिशाली है।

4

यह एक दिलचस्प सवाल है। यादृच्छिक मूल्यों को उत्पन्न करना काफी आसान है - डीबीएमएस_आरएनडीओएम को कॉल के साथ डेटा डिक्शनरी के चारों ओर एक साधारण लूप चाल करेगा।

दो चीजों को छोड़कर।

एक है, जैसा कि @FrustratedWithForms बताता है, विदेशी कुंजी बाधाओं की जटिलता है। आइए मिश्रण में टिप लुकअप वैल्यू (संदर्भ डेटा) भी दें।

दूसरा, यादृच्छिक बहुत यथार्थवादी नहीं है। यादृच्छिक डेटा का उपयोग करने के लिए मुख्य चालक डेटा की बड़ी मात्रा की आवश्यकता है, शायद प्रदर्शन परीक्षण के लिए। लेकिन वास्तविक डेटासेट यादृच्छिक नहीं हैं, उनमें स्कीज़ और क्लंप, परिवर्तनीय स्ट्रिंग लम्बाई और निश्चित रूप से पैटर्न होते हैं (विशेष रूप से जहां तिथियां संबंधित हैं)।

तो, यादृच्छिक डेटा उत्पन्न करने की कोशिश करने के बजाय, मुझे सुझाव है कि आप एक वास्तविक डेटासेट प्राप्त करने का प्रयास करें। आदर्श रूप में आपका उपयोगकर्ता/ग्राहक एक, अधिमानतः अनामित प्रदान करने में सक्षम होगा। अन्यथा कुछ ऐसा करने का प्रयास करें जो पहले से ही सार्वजनिक डोमेन में है, और अपनी विशिष्ट आवश्यकताओं के अनुरूप इसे मालिश करें। जब इन मामलों की बात आती है तो इन्फो चिम्पस शीर्ष केले होते हैं। Check them out

+1

+1, चेक और नल बाधाओं के साथ और अधिक जटिलताएं उत्पन्न होती हैं। – DCookie

संबंधित मुद्दे