2010-07-22 15 views
8

मैं डेटा वेयरहाउसिंग में नया हूं। सबसे पहले, मैं डेटाटायरहाउस टूलकिट की अपनी प्रति से सटीक नहीं होना चाहता हूं, यह मेरे मेलबॉक्स (घोंघा मेल: पी) के रास्ते पर है। लेकिन मैं नेट पर जो कुछ पाता हूं उसके साथ मैं इन सब चीजों का अध्ययन कर रहा हूं।एक से अधिक तथ्य सारणी के साथ डेटा वेयरहाउस का डिज़ाइन

जो मुझे नेट पर नहीं मिलता है, हालांकि, ऐसा लगता है कि जब आप डीडब्ल्यू में एक से अधिक तथ्य रखते हैं तो क्या करना है। मेरे मामले में (बीमा), मेरे पास धनवापसी होती है जो गैर नियमित आधार पर होती है। एक ग्राहक के पास 3 महीने और फिर दस महीनों में कोई नहीं हो सकता है। दूसरी तरफ, मेरे पास "सदस्यता शुल्क" है (सुनिश्चित नहीं है कि सही अंग्रेजी शब्द क्या है, लेकिन आपको बिंदु मिल गया है), जो हर महीने या हर तीन महीने में होता है। ऐसा लगता है कि मुझे दो अलग-अलग तथ्यों की तरह क्लर्कली लगता है।

वे भी कुछ आयामों जैसे ग्राहक या "बीमा उत्पाद" के साथ मिलकर कमजोर होते हैं। अब ये दो differents गोदाम हैं, जिस पर मुझे दो अलग-अलग रिपोर्ट तैयार करनी है और फिर डीडब्ल्यू के बाहर रिपोर्ट को जोड़ना है? या एक एकल वंश डीडब्ल्यू फिट करने के लिए इसे डिजाइन करने का कोई तरीका है। या क्या मुझे इन दो तथ्यों को एक साथ जोड़ना चाहिए? मैं फिर धनवापसी पर ग्रैन्युलरिटी खो देता।

कुछ ब्लॉग मैंने पढ़ा है कि एक डीडब्ल्यू हमेशा एक तथ्य तालिका है। अन्य एस के साथ तथ्य सारणी बनाने के चरण का जिक्र करते हैं, लेकिन उनके बीच कोई लिंक होने पर कोई स्पष्ट निर्देश नहीं है या वे एक ही डीडब्ल्यू परियोजना के विशिष्ट अनुलग्नक हैं।

क्या किसी को डीडब्ल्यू डिजाइन के उस सटीक हिस्से पर कुछ संदर्भ पता हैं?

उत्तर

7

अपने प्रश्न पीछे की तरफ लेना।

डेटा वेयरहाउस में एक से अधिक तथ्य तालिका हो सकती है। हालांकि, आप तथ्य सारणी के बीच जुड़ना कम करना चाहते हैं। विभिन्न तथ्य सारणी में तथ्य जानकारी डुप्लिकेट करना ठीक है।

आपके द्वारा उल्लिखित वस्तुओं में से:

धनवापसी एक तथ्य है। टाइमस्टैम्प धनवापसी तथ्य का आयाम है।

सदस्यता शुल्क एक तथ्य है। टाइमस्टैम्प सदस्यता शुल्क तथ्य का आयाम है।

एक धनवापसी एक से अधिक बार हो सकती है। मैं अनुमान लगा रहा हूं कि प्रत्येक ग्राहक के पास एक सदस्यता शुल्क होता है। तो ऐसा प्रतीत होता है कि हमारे पास अब तक दो तथ्य सारणी हैं, ग्राहक, और ग्राहक धनवापसी।

यदि आप जानते थे कि केवल 3 धनवापसी (उदाहरण के रूप में) हो सकती है, तो आप ग्राहक रिफंड तथ्य तालिका को खत्म कर देंगे, और ग्राहक तालिका में 3 धनवापसी कॉलम डाल देंगे।

आप बीमा का भी उल्लेख करते हैं। एक ग्राहक के पास एक से अधिक नीति हो सकती है। तो हमारे पास तीसरी तथ्य तालिका है।

डेटा वेयरहाउस आमतौर पर star schema का उपयोग करके डिज़ाइन किया गया है। स्टार स्कीमा मूल रूप से एक या अधिक आयाम तालिकाओं से जुड़ी एक तथ्य तालिका है। डेटा वेयरहाउस में आपके पास शायद एक से अधिक स्टार होंगे, क्योंकि हमने पहले ही 3 तथ्य सारणी परिभाषित की हैं।

14

आपके पास जितनी चाहें उतनी तथ्य सारणी हो सकती हैं। सदस्यता उन में से एक होने -

fact_ins_transaction

dimProduct सूचियों कई उत्पादों: अपने उदाहरण में आप की तरह कुछ हो सकता है। dimTransactionType संभव लेनदेन है (खरीद, वापसी, आवर्ती सदस्यता शुल्क ...)

अब मान लीजिए कि आप सरलीकृत सदस्यता रिपोर्टिंग में रुचि रखते हैं, तो आप एक factSubscription इस तरह जोड़ सकते हैं:

fact_ins_subscription

13

मुझे एहसास है कि मैं एक पुरानी पोस्ट का जवाब दे रहा हूं, लेकिन मैं प्रदान किए गए उत्तरों में से किसी से भी संतुष्ट नहीं हूं। मुझे लगता है कि न तो सवाल का जवाब दिया।

एक स्कीमा में एक या अधिक तथ्य हो सकते हैं, लेकिन ये तथ्य किसी भी महत्वपूर्ण संबंध से जुड़े नहीं हैं। यह एक सर्वोत्तम प्रश्न है कि एक सामान्य प्रश्न/लेनदेन डेटाबेस से पूछताछ करने के लिए एक प्रश्न में तथ्य सारणी में शामिल न होना। कई लोगों की प्रकृति के कारण, कई शामिल होते हैं - प्रयास किए जाने पर परिणाम गलत होंगे।

जो उत्तर आप खोज रहे हैं वह यह है कि आपको "ड्रिल भरने" की आवश्यकता है जिसका मूल रूप से मतलब है कि आप प्रत्येक तथ्य तालिका (स्कीमा) को अलग से पूछ रहे हैं और परिणामों को विलय कर रहे हैं। यह एसक्यूएल या अधिमानतः एक रिपोर्टिंग/एनालिटिक्स टूल के माध्यम से हो सकता है जो आपके पास डेटा वेयरहाउस का संदर्भ दे सकता है। इसके बजाय ऐसा करने के तरीके पर जवाब डुप्लिकेट करने की, मैं दो बहुत अच्छा लेख के लिए हर किसी को निर्देशित करेंगे:

Three ways to drill across by Chris Adamson

और

Should of the Warehouse - Drilling Across by Ralph Kimball

+0

जबकि लिंक उत्कृष्ट संदर्भ थे। मैं समझ नहीं पा रहा हूं कि लेखक का क्या अर्थ है जब वह कहता है "याद रखें कि एक से अधिक तथ्य तालिका से तथ्यों को लाने के लिए प्रश्नों के सावधानीपूर्वक निर्माण की आवश्यकता होती है। दो तथ्यों को एक साथ जोड़ना उचित नहीं है, न ही साझा आयामों के माध्यम से उन्हें जोड़ने के लिए उचित है। ऐसा करने से दोगुना होगा तथ्यों की गणना, उन्हें तीन गुना, या बदतर। " कर सकते हैं – bigdatamann

संबंधित मुद्दे