2015-10-27 5 views
5

मुझे एक ही Azure SQL डेटाबेस से डेटा के साथ सोर्स किए गए Azure SQL डेटा वेयरहाउस का उपयोग करके डेटा वेयरहाउस बनाने की आवश्यकता है। this article को देखते हुए, ऐसा लगता है मैं दो विकल्प हैं:एज़ल एसक्यूएल डाटाबेस से एज़एल एसक्यूएल डाटाबेस वेयरहाउस से ईटीएल डेटा के लिए अनुशंसित टूल्स?

  • लघु उद्योगों
  • Azure डाटा फैक्टरी

मेरे Azure SQL डेटाबेस सामान्यीकृत है, लेकिन मैं में मेरी Azure एसक्यूएल डाटा गोदाम का निर्माण करना चाहते हैं एक सितारा या हिमपात का स्कीमा प्रारूप, इसलिए यह टेबल की एक सीधी प्रति नहीं है - निश्चित रूप से कुछ परिवर्तन होने की आवश्यकता है।

दिया गया एसएसआईएस Azure SQL डेटाबेस पर समर्थित नहीं है और मुझे प्रक्रियाओं को पूरी तरह से Azure में रखने के लिए SQL सर्वर के साथ एक वीएम चलाने की आवश्यकता होगी, Azure डेटा फैक्टरी Azure SQL डेटाबेस और Azure के बीच ईटीएल डेटा के लिए अनुशंसित टूल है एसक्यूएल डेटा वेयरहाउस? क्या इस विकल्प में एक विकल्प बनाम दूसरे को पूरी तरह से दिखाया जाएगा?

धन्यवाद!

उत्तर

4

यदि आप अपनी प्रक्रियाओं को पूरी तरह से क्लाउड में रखना चाहते हैं और वीएम नहीं बढ़ाते हैं, तो Azure डेटा फैक्टरी वर्तमान में डेटा आंदोलन के लिए आपका सबसे अच्छा विकल्प है। हालांकि, इस समय मैं एक ईटीएल दृष्टिकोण पर ईएलटी दृष्टिकोण की सिफारिश कर सकता हूं। अपने डेटा को पहले लोड करके और फिर SQL डेटा वेयरहाउस के भीतर अपने परिवर्तनों को पूरा करके अपने लोड तेज हो जाएंगे और आप अपने डेटा को बदलने के दौरान अतिरिक्त गणना शक्ति का लाभ उठा सकेंगे। इसके अतिरिक्त, ऐसा लगता है कि आप एसक्यूएल से परिचित हैं, इसलिए डेटा फैक्टरी 'जेएसओएन का उपयोग करने के विरोध में एसक्यूएल डेटा वेयरहाउस के अंदर अपने परिवर्तन लिखना आपके लिए आसान हो सकता है।

+0

से प्रतिक्रिया के लिए धन्यवाद! एक मामूली अनुवर्ती - एसक्यूएल डेटा वेयरहाउस के अंदर परिवर्तन करने के लिए कौन सा उपकरण सबसे अच्छा होगा? हम स्नैपशॉट-स्टाइल टेबल के माध्यम से ऐतिहासिक डेटा कैप्चर करना चाहते हैं जिसे हम सम्मिलित करेंगे लेकिन अपडेट नहीं करेंगे, (यानी इस दिन आप वाई वाई से जुड़े थे) साथ ही साथ आयाम डेटा जो डाला और अपडेट किया जाएगा। क्या यह किसी प्रकार की प्रक्रिया होगी जिसे एडीएफ गतिविधि के पूरा होने से ट्रिगर किया जा सकता है और संभवतः स्टार/हिमपात का स्कीमा टेबल तैयार करने के लिए एडीडब्ल्यू पर कुछ स्पॉक्स निष्पादित करता है? – tarun713

+1

डेटा फैक्टरी आपको पाइपलाइनों में [SQLServerStoredProcedure] (https://azure.microsoft.com/en-us/documentation/articles/data-factory-stored-proc-activity/) गतिविधि के साथ-साथ अपने परिवर्तनों को शेड्यूल करने की अनुमति देगा। । यह आपको ट्रिगर की आवश्यकता के बिना एक के रूप में अपने डेटा आंदोलन और sprocs शेड्यूल करने की अनुमति देनी चाहिए। –

+0

@ tarun713 हां, ठीक है, एडीएफ गतिविधियां एक गतिविधि को पूरा करने के लिए "साफ" संग्रहित प्रक्रिया को चलाने की अनुमति देती हैं, यह कुछ मास्टर संग्रहीत प्रक्रिया होगी जो आपके स्टार स्कीमा को पॉप्युलेट करने के लिए सभी काम करेगी। –

0

यह देखने में देखें कि क्या आपके Azure SQL डेटाबेस पर इंगित करने के लिए बाहरी तालिका (डीडब्ल्यू में) बनाना आपकी मदद करेगा। इसके साथ, आप सितारों/स्नोफ्लेक्स में संरचना को बदलने के लिए कुछ बनाएं तालिका (सीटीएएस) कमांड जारी करने से दूर हो सकते हैं।

https://msdn.microsoft.com/en-us/library/dn935022.aspx

--Create an external data source for a remote database on Azure SQL Database 
CREATE EXTERNAL DATA SOURCE data_source_name 
    WITH ( 
     TYPE = RDBMS, 
     LOCATION = '<server_name>.database.windows.net', 
     DATABASE_NAME = 'Remote_Database_Name', 
     CREDENTIAL = SQL_Credential 
    ) 
[;] 
+0

यह आलेख fleshes-out कैसे काम करता है। https://azure.microsoft.com/en-us/documentation/articles/sql-database-elastic-query-getting-started-vertical/ – fchukoskie

+0

प्रतिक्रिया के लिए धन्यवाद! यह बहुत रोचक है और मुझे इसके बारे में पता नहीं था, हालांकि, हमारे लक्ष्यों में से एक डेटा वेयरहाउस डीबी बनाना है ताकि हमारे द्वारा चलाए जाने वाले किसी भी विश्लेषिकी को हमारे संबंधपरक डेटाबेस पर लोड डालने से बचें। इसे कार्यान्वित करने के दौरान हमें कुछ आयाम तालिकाओं में डेटा पर प्रतिलिपि बनाने में मदद मिल सकती है, लोड अभी भी हमारे संबंधपरक डेटाबेस पर रहेगा - इसलिए मुझे नहीं लगता कि यह हमारे लिए एक विकल्प है। – tarun713

+0

जब भी आप डेटा ले जाते हैं, भले ही आप इसे कैसे स्थानांतरित करते हैं, रिलेशनल डीबी पर लोड होने जा रहा है। मुझे लगता है कि यह विचार केवल डाटा पुश (एसएसआईएस या डेटा फैक्ट्री का उपयोग करके) एक डेटा पुल बनाम तर्क (बाहरी सीटीएएस कमांड के साथ सहेजते समय बाहरी तालिका से पूछताछ) का एक अंतर है। एक बार जब नई तालिका लोड हो जाती है, तो रिलेशनशिप डीबी समाप्त होने पर आपका भार समाप्त होता है, और आप अपने शेष कार्य को आपके द्वारा लोड की गई नई तालिका पर करते हैं। इसलिए, बाहरी तालिका लोड के दौरान उपयोग की जाने वाली एक अंतरिम चरण है ... अंतिम तालिका नहीं जिसे आप पूछेंगे। – fchukoskie

संबंधित मुद्दे