2014-10-13 13 views
16

की तुलना में Google BigQuery बनाम अमेज़ॅन रेडशिफ्ट की तुलना में दिखाता है कि दोनों आवश्यकताओं के एक ही सेट का जवाब दे सकते हैं, ज्यादातर लागत योजनाओं से अलग है। ऐसा लगता है कि Redshift को कॉन्फ़िगर करने के लिए अधिक जटिल है (कुंजी और ऑप्टिमाइज़ेशन कार्य को परिभाषित करना) बनाम Google BigQuery जो शायद टेबल में शामिल होने के साथ कोई समस्या है।BigQuery बनाम अमेज़ॅन Redshift

क्या कोई समस्या & Google BigQuery बनाम अमेज़ॅन रेडशिफ्ट की विपक्ष सूची है?

+1

कोशिश Quora, आपके सवाल वहाँ अधिक उपयुक्त है ... –

+0

http://www.quora.com/How पर एक नज़र -गुड-इज़-गूगल्स-बिग-क्वेरी-ए-तुलना-से-अमेज़ॅन-रेड-शिफ्ट –

+0

बेशक मैंने वहां देखा है, मैंने सोचा कि मैं शुद्ध विकास और एकीकरण दृष्टिकोण से एक और परिप्रेक्ष्य प्राप्त कर सकता हूं। फिर भी धन्यवाद। – user2339344

उत्तर

10

अमेज़ॅन रेडशिफ्ट एमपीपी सुविधाओं के साथ एक मानक SQL डेटाबेस (पोस्टग्रेज़ पर आधारित) है जो इसे स्केल करने की अनुमति देता है। इन सुविधाओं में आपको सर्वश्रेष्ठ प्रदर्शन प्राप्त करने के लिए कुछ हद तक अपने डेटा मॉडल को अनुरूप बनाने की आवश्यकता होती है। यह SQL मानक की एक बड़ी मात्रा का समर्थन करता है और पोस्टग्रेस से बात करने वाले अधिकांश टूल अपरिवर्तित का उपयोग कर सकते हैं।

BigQuery डेटाबेस नहीं है, in the sense that there it doesn't use standard SQL and doesn't provide JDBC/ODBC connectivity। यह अपने स्वयं के एपीआई और इंटरफेस के साथ एक अनूठी सेवा है। यह एसक्यूएल प्रश्नों के लिए सीमित समर्थन प्रदान करता है लेकिन अधिकांश उपयोगकर्ता कस्टम कोड (जावा, पायथन, आदि) के माध्यम से बातचीत करते हैं। कुछ तृतीय पक्ष औजारों ने BigQuery के लिए समर्थन जोड़ा है लेकिन मौजूदा उपकरण संशोधन के बिना काम नहीं करेंगे।

टीएल; डॉ - रेडशिफ्ट मौजूदा उपकरणों के साथ बातचीत करने और जटिल एसक्यूएल का उपयोग करने के लिए बेहतर है। BigQuery कस्टम कोडित इंटरैक्शन और एसक्यूएल को नापसंद करने वाली टीमों के लिए बेहतर है।

अद्यतन 2017-04-17 - यहां लागत और गति अंतर (एक बिक्री पिच में लिपटे गए वाईएमएमवी) में एक बहुत अधिक अद्यतित सारांश है। टीएल; डीआर - रेडशिफ्ट आमतौर पर तेज़ होता है और यदि आप डेटा को कुछ हद तक नियमित रूप से पूछते हैं तो सस्ता होगा। http://blog.panoply.io/a-full-comparison-of-redshift-and-bigquery

+3

बीक्यू एक स्तंभ वितरित डीबी है। अपने स्वयं के एसक्यूएल उच्चारण के साथ आसानी से पूछताछ की जा सकती है। मुख्य अंतर मानक डीबी, एटीएल, यूई टूल्स के साथ एकीकरण की आसानी होगी, यहां रेडशिफ्ट का मामूली लाभ है। और प्रशासन के लिए आवश्यक प्रयास, यहां बीक का कुछ फायदा है। –

+2

ठीक है, उचित बिंदु, बीक्यू _technically_ 'स्तंभ कॉलम' है और _practically_ मौजूदा उपकरणों के असंख्य से जेडीबीसी/ओडीबीसी कनेक्शन का समर्थन करने के अर्थ में 'डेटाबेस' नहीं है। –

+2

यह लगभग तीन वर्षों तक रहा है, और यह उसी तकनीक पर बनाया गया है जिसे Google स्वयं उपयोग करता है। आप शायद क्यों सोचेंगे कि इसे छोड़ दिया जा रहा है? क्या Google ने अन्य क्लाउड टेक छोड़ा है? – aronchick

30

मैंने इस तुलना को reddit पर पोस्ट किया। एक लंबे समय तक पर्याप्त रेडशफ्ट व्यवसायी मेरे बयान पर टिप्पणी करने आया। पूर्ण बातचीत के लिए कृपया https://www.reddit.com/r/bigdata/comments/3jnam1/whats_your_preference_for_running_jobs_in_the_aws/cur518e देखें।

अपने क्लस्टर नौकरशाही का आकार घटाने:

  • Redshift सीपीयू, रैम, HD, आदि के एक नंबर का चयन करने के लिए कहेगा और उन्हें चालू करने के लिए।
  • BigQuery परवाह नहीं है। जब भी आप चाहें इसका इस्तेमाल करें, कोई प्रावधान की आवश्यकता नहीं है।

प्रति घंटा की लागत जब कुछ नहीं कर रहे:

  • Redshift आप से पूछना प्रति चल रहा है, तब भी जब आप कुछ भी नहीं कर रहे हैं इन सर्वरों में से प्रत्येक के घंटे भुगतान करने के लिए होगा।
  • जब निष्क्रिय BigQuery केवल प्रति जीबी संग्रहीत प्रति माह $ 0.02 चार्ज करता है। प्रति जीबी प्रति माह 2 सेंट, यह है।

प्रश्नों की गति:

  • Redshift प्रदर्शन CPU की राशि है जो आप के लिए
  • BigQuery भुगतान कर रहे हैं के रूप में सेकंड में आपकी क्वेरी चलाने के लिए आवश्यक पारदर्शी रूप से के रूप में कई संसाधनों में लाता है द्वारा सीमित है।

अनुक्रमण: विशेष मानदंडों के अंतर्गत अपने डेटा, और आप केवल इस सूचकांक के आधार पर तीव्र क्वेरी को चलाने के लिए सक्षम हो जाएगा:

  • Redshift सूचकांक करने के लिए कहेगा (वितरित सुधार)।
  • BigQuery में कोई अनुक्रमणिका नहीं है। हर ऑपरेशन तेज़ है।

Vacuuming:

  • Redshift आवधिक रखरखाव और अंतिम घंटे कि 'वैक्यूम' आपरेशन की आवश्यकता है। आप इन सर्वर घंटों में से प्रत्येक के लिए भुगतान कर रहे हैं।
  • BigQuery नहीं करता है। 'वैक्यूमिंग' के बारे में भूल जाओ।

डाटा विभाजन और वितरण:

  • Redshift अपने सर्वर के भीतर डेटा वितरित करने के लिए कैसे प्रदर्शन को बनाए रखने के बारे में सोचने की आवश्यकता है - अनुकूलन केवल कुछ प्रश्नों के लिए काम करता है।
  • BigQuery नहीं करता है। बस जो भी सवाल आप चाहते हैं उसे चलाएं।

स्ट्रीमिंग लाइव डेटा: (?)

  • असंभव Redshift साथ।
  • BigQuery आसानी से प्रति टेबल प्रति 100,000 पंक्तियों में प्रवेश करने के लिए संभालता है।

अपने क्लस्टर बढ़ते:

  • आप और अधिक डेटा है, तो या अधिक समवर्ती उपयोगकर्ताओं स्केलिंग Redshift साथ दर्दनाक हो जाएगा।
  • BigQuery बस काम करेगा।

मल्टी क्षेत्र:

  • आप उपलब्धता और डेटा अखंडता के लिए एक बहु क्षेत्र Redshift करना चाहते हैं? दर्दनाक।
  • BigQuery डिफ़ॉल्ट रूप से बहु-ज़ोन है।

BigQuery को आजमाने के लिए आपको क्रेडिट कार्ड या किसी सेटअप समय की आवश्यकता नहीं है। बस इसे आजमाएं (quick instructions to try BigQuery)।

जब आप अपने स्वयं के डेटा को BigQuery में रखने के लिए तैयार होते हैं, तो बस अपने JSON नए-लाइन से अलग लॉग को Google क्लाउड स्टोरेज से कॉपी करें और उन्हें आयात करें।

इस देखें बादल पर डेटा गोदाम मूल्य निर्धारण के लिए गहराई गाइड में: Understanding Cloud Pricing Part 3.2 - More Data Warehouses

+0

"BigQuery को आजमाने के लिए आपको क्रेडिट कार्ड की आवश्यकता नहीं है" अब सच नहीं है - मुझे निशुल्क परीक्षण सेट अप करने के लिए क्रेडिट कार्ड विवरण जोड़ना पड़ा। या फिर भी एक रास्ता है? – user3853657

+1

https://cloud.google.com/blog/big-data/2017/01/how-to-run-a-terabyte-of-google-bigquery-queries-each-month-without-a- क्रेडिट- कार्ड –