हम एक बैंक के लिए डाटावायरहाउस पर काम कर रहे हैं और प्रक्रिया के माध्यम से डेटा खींचने के लिए स्टेजिंग टेबल, एक स्टार स्कीमा और एक ईटीएल के मानक किमबॉल मॉडल का काफी पालन किया है।डेटा गोदाम के स्टेजिंग क्षेत्र के भीतर संरचना
किमबाल आयात, सफाई, प्रसंस्करण और सब कुछ के लिए स्टेजिंग क्षेत्र का उपयोग करने के बारे में बात करता है जब तक कि आप डेटा स्कीमा में डेटा डालने के लिए तैयार न हों। प्रैक्टिस में इसका मतलब आम तौर पर स्रोतों से डेटा को कम या कोई संशोधन वाले टेबल के सेट में अपलोड करना है, इसके बाद इंटरमीडिएट टेबल के माध्यम से वैकल्पिक रूप से डेटा लेना जब तक कि वह स्टार स्कीमा में जाने के लिए तैयार न हो। यह एक इकाई के लिए बहुत काम है, यहां कोई भी जिम्मेदारी नहीं है।
पिछला सिस्टम मैं होने की हद तक पर तालिकाओं के विभिन्न सेट के बीच एक अंतर बना दिया है काम किया है,:
- अपलोड टेबल: कच्चे स्रोत प्रणाली डेटा, असंशोधित
- स्टेजिंग टेबल: मध्यवर्ती प्रसंस्करण, टाइप और साफ
- वेयरहाउस टेबल
आप अलग स्कीमा में इन छड़ी कर सकते हैं और उसके बाद संग्रह/बैकअप/सुरक्षा आदि अन्य लोगों में से एक एक गोदाम में काम किया है जहां एक StagingInput और एक StagingOutput, इसी तरह की कहानी के लिए अलग-अलग नीतियां लागू होती हैं । पूरी तरह से टीम के पास डाटावायरहाउस और अन्यथा बहुत अनुभव है।
हालांकि, इसके बावजूद, किमबाल और वेब के माध्यम से देखकर स्टेजिंग डेटाबेस में किसी प्रकार की संरचना देने के बारे में लिखित में बिल्कुल कुछ नहीं लगता है। एक को यह विश्वास करने के लिए क्षमा किया जाएगा कि श्री किमबाल हमें डेटा के इस बड़े गहरे अंधेरे अनियंत्रित पूल के रूप में मंचन के साथ काम करेंगे।
जबकि निश्चित रूप से यह स्पष्ट है कि अगर हम स्टेजिंग क्षेत्र में कुछ और संरचना जोड़ना चाहते हैं, तो यह बहुत अजीब लगता है कि इसके बारे में कुछ भी नहीं लिखा गया है।
तो, हर कोई क्या कर रहा है? क्या यह सिर्फ इतना बड़ा असंगठित गड़बड़ है या लोक लोगों के पास कुछ दिलचस्प डिजाइन हैं?
जिज्ञासा, एक ऐसा क्षेत्र जहां कोई भी दिलचस्पी नहीं लेता है, फिर भी कोई भी जो किसी भी पैमाने पर प्रत्येक बीआई परियोजना को प्रभावित करता है। मुझे लगता है कि अपलोड और स्टेजिंग भेद हमें कम से कम कुछ संरचना देगा। – NeedHack