6

अगर मुझे पहले से ही पूछा गया है तो मुझे क्षमा करें (मुझे डेटा वेयरहाउस/बीआई के बारे में बहुत कम पता है और अभी तक कीवर्ड को महारत हासिल नहीं है)।डेटा एकत्रीकरण - दैनिक एसक्यूएल स्क्रिप्ट बनाम डेटा वेयरहाउस

मेरे पास एक सारणी है जो प्रति दिन 100 000 पंक्तियों से बढ़ती है, प्रत्येक पंक्ति में टाइमस्टैम्प होता है और किसी आइटम (आयाम, वजन, रंग इत्यादि) के बारे में कई जानकारी होती है। इस अवधि के लगभग एक माह के लिए व्यक्तिगत डेटा उपयोगी हो सकता है, हम केवल एकत्रीकरण में रूचि रखते हैं। मेरे पास एक समर्पित सॉफ़्टवेयर है जो व्यक्तिगत पंक्तियों के अधिक विस्तृत विज़ुअलाइजेशन की अनुमति देता है और मुख्य रूप से मेरी रिपोर्टिंग आवश्यकताओं के लिए PowerPivot का उपयोग करता है।

मैं एक एसक्यूएल क्वेरी के साथ आ सकता हूं जो प्रतिदिन एक नई तालिका भर लेगा: जिसमें प्रत्येक घंटे/आइटम/बैच के लिए मेरी पंक्ति होगी और मैं जानकारी (योग/औसत/stddev/etc) सारांशित करूंगा।)

एक दिन के भीतर मेरी लिपि ऊपर और चल रही होगी और मैं इस नई तालिका के खिलाफ पावरपीवॉट का उपयोग कर सकता हूं। यह सब रहते हुए जहां मैं आरामदायक हूं: सादा पुराना एसक्यूएल।

डेटावारेहाउस और बीआई के बारे में पढ़ने वाली कुछ जानकारी से, जो मैं करने जा रहा हूं वह आयाम और तथ्यों को बनाने जैसा बहुत कुछ लगता है। इसलिए मेरा सवाल: क्या उस दिशा में आगे की जांच करना उचित है (बीआई) या चूंकि मेरी समस्या अपेक्षाकृत सरल है, मैं एक संबंधपरक डेटाबेस में बेहतर रहूंगा।

एनबी। उत्पादित होने वाली रिपोर्ट आमतौर पर अधिक सार्थक सूचनाओं के उत्पादन के लिए किसी अन्य डेटाबेस के खिलाफ जुड़ी होती हैं। कार्य जो Powerpivot द्वारा बहुत अच्छी तरह से पूरा किया जाता है।

उत्तर

3

डेटावायरहाउस आमतौर पर संबंधित डेटाबेस में कार्यान्वित किए जाते हैं, इसलिए आपके मौजूदा कौशल अभी भी उपयोग योग्य होंगे।

  • दिनांक गोदाम टूलकिट (Kimball, रॉस)
  • :

    यह देखते हुए कि आप Datawarehousing के लिए आयाम/तथ्य तालिका दृष्टिकोण में रुचि व्यक्त की है, इस दृष्टिकोण पर विहित किताबें आम तौर पर माना जाता है

  • दिनांक गोदाम जीवनचक्र टूलकिट (Kimball, रॉस, Thornthwaite, Mundy, बेकर)

(जबकि बाद एक व्यापक जीवन चक्र प्रबंधन के दृष्टिकोण से विषय दृष्टिकोण पूर्व, एक तकनीकी ध्यान देने का भी अधिक है।)

डीडब्ल्यूएच लागू करना समय लेने वाला हो सकता है, इसलिए यदि आप डीडब्ल्यूएच बनाने का निर्णय लेते हैं तो भी आपके मौजूदा दृष्टिकोण के साथ जारी रहना उचित हो सकता है।

+0

यदि मैं सभी उत्तरों को स्वीकार कर सकता हूं, तो मैं उन सभी पहलुओं को लाता हूं जो मुझे निर्णय लेने में मदद करते हैं (अब इसे सरल रखें)। लेकिन चूंकि इसने मुझे कुछ और पढ़ने की ओर इशारा किया है, इसलिए मैं आगे बढ़ूंगा और इसे स्वीकार करूंगा। धन्यवाद – Benoittr

1

सबसे प्रभावी समाधान वे हैं जो मौजूदा आवश्यकताओं को पूरा करने के लिए सरल, पर्याप्त उपलब्ध हैं और उपलब्ध कौशल के भीतर रहते हैं।

मैं मानता हूं कि यह दृष्टिकोण आपकी स्थिति के लिए अच्छी तरह से काम करता है अगर यह आपको आवश्यक रिपोर्ट और जानकारी प्रदान करता है तो इस तरह से शुरू करने के लायक है। यदि आपको बाद में अधिक जटिल कार्यक्षमता की आवश्यकता है तो आप अधिक जटिल बीआई

2

अच्छी खबर: ऐसा लगता है कि आपके पास पहले से ही डेटा वेयरहाउस है। "डेटा वेयरहाउस" एक बहुत ही सामान्य शब्द है, जिसमें वास्तविक औपचारिक परिभाषा नहीं है - यह जो भी आप चाहते हैं उसका बहुत अधिक मतलब है।

आमतौर पर स्वीकार किया विशेषताएं हैं:

  • डाटा गोदामों परिचालन डेटाबेस
  • डाटा गोदामों स्कीमा क्वेरी करने के लिए अनुकूलित कर रहे हैं पर नहीं चलते हैं, "सामान्य रूप" अनुपालन
  • डाटा गोदामों की आबादी रहे हैं के लिए नहीं "एक्सट्रैक्ट, ट्रांसफॉर्म, लोड" प्रोसेस (ईटीएल)।

ऐसा लगता है कि आप पहले से ही ऐसा कर रहे हैं। यदि बदलने के लिए कोई व्यावसायिक आवश्यकता नहीं है, तो मैं इसे छोड़ दूंगा। यदि आपके व्यवसाय उपयोगकर्ता एकत्रीकरण, फ़िल्टरिंग या ग्रॅन्युलरिट के विभिन्न स्तरों का उपयोग करके अपने स्वयं के प्रश्न बनाने के लिए कह रहे हैं, तो स्टार स्कीमा जाने का तरीका हो सकता है।

संबंधित मुद्दे