से डेटा सिंक्रनाइज़ करें हम अमेज़ॅन रेडशफ्ट में विशाल डेटासेट पर कुछ एकत्रीकरण करते हैं, और हमारे पास MySQL में कुछ अपेक्षाकृत कम मात्रा में डेटा है। RedShift में शामिल होने के लिए हमें MySQL में डेटा की आवश्यकता है। MySQL डेटा को RedShift में सिंक्रनाइज़ करने का सबसे अच्छा तरीका क्या है? क्या रेडशिफ्ट में ओरेकल में रिमोट व्यू जैसी कोई चीज है? या क्या मुझे प्रोग्रामिंग रूप से MySQL क्वेरी करना चाहिए और RedShift में डालें/अपडेट करना चाहिए?MySQL से अमेज़ॅन RedShift
उत्तर
जब रेडशिफ्ट में शामिल होने के लिए MySQL डेटा की आवश्यकता होती है, तो हम आमतौर पर इसे एक से दूसरे में भेजते हैं।
यह अर्थ है:
- Redshift: एक अनुरूप तालिका स्कीमा बनाना (मन Redshift में असर/psql की विशेषताओं)
- MySQL: डेटा तालिका डम्पिंग
- (csv प्रारूप में) निर्यात ज़िप किया जा रहा, तालिका छोटा किया जा रहा है, और का उपयोग करके सभी डेटा आयात करने की नकल
कदम: और S3
रेडशिफ्ट अब एसएसएच के माध्यम से loading data from remote hosts का समर्थन करता है। इस तकनीक शामिल है:
- दूरस्थ होस्ट (रों)
- क्लस्टर नोड्स के आईपी पते से दूरस्थ होस्ट (ओं) को SSH पहुंच की अनुमति देने पर authorized_keys फाइल करने के लिए क्लस्टर से सार्वजनिक कुंजी जोड़ना
- रिमोट होस्ट (ओं), सार्वजनिक कुंजी (ओं), और रिमोट होस्ट
- पर निष्पादित करने के लिए कमांड को जेएसओएन मैनिफेस्ट अपलोड करना एक निर्दिष्ट मैनिफेस्ट फ़ाइल और एडब्लूएस क्रेडेंशियल्स के साथ COPY कमांड चला रहा है
मैनिफेस्ट द्वारा निर्दिष्ट कमांड एक मनमानी कमांड चलाता है जो Redshift COPY कमांड द्वारा format suitable for ingest में टेक्स्ट आउटपुट प्रिंट करता है।
माइस्क्ल डेटा को Redshift लोड करने के लिए यह simplest way देखें। जब आपकी अपेक्षा केवल प्रारंभिक डेटा स्नैपशॉट को Redshift पर लोड कर रही है, तो उस मुफ्त समाधान के साथ प्रयास करें। इसके अलावा आपको स्कीमा माइग्रेशन, साइड बाय साइड कंसोल कंसोल और पूरी लोडिंग प्रक्रिया के कुछ सांख्यिकीय रिपोर्ट (चार्ट के साथ) मिल जाएगा।
ओरेकल में "रिमोट व्यू" क्या है?
वैसे भी, यदि आप तालिका से सीएसवी फ़ाइल में डेटा निकाल सकते हैं तो आपके पास एक और स्क्रिप्टिंग विकल्प है। अमेज़ॅन रेडशिफ्ट में अपने सीएसवी लोड को स्क्रिप्ट करने के लिए आप पाइथन/बोटो/psycopg2 कॉम्बो का उपयोग कर सकते हैं।
मेरे MySQL_To_Redshift_Loader मैं निम्नलिखित है:
निकालें अस्थायी फ़ाइल में MySQL से डेटा। एस 3 को
loadConf=[ db_client_dbshell ,'-u', opt.mysql_user,'-p%s' % opt.mysql_pwd,'-D',opt.mysql_db_name, '-h', opt.mysql_db_server] ... q=""" %s %s INTO OUTFILE '%s' FIELDS TERMINATED BY '%s' ENCLOSED BY '%s' LINES TERMINATED BY '\r\n'; """ % (in_qry, limit, out_file, opt.mysql_col_delim,opt.mysql_quote) p1 = Popen(['echo', q], stdout=PIPE,stderr=PIPE,env=env) p2 = Popen(loadConf, stdin=p1.stdout, stdout=PIPE,stderr=PIPE) ...
कम्प्रेस और लोड डेटा boto पायथन मॉड्यूल और बहुखण्डीय अपलोड का उपयोग कर।
conn = boto.connect_s3(AWS_ACCESS_KEY_ID,AWS_SECRET_ACCESS_KEY) bucket = conn.get_bucket(bucket_name) k = Key(bucket) k.key = s3_key_name k.set_contents_from_file(file_handle, cb=progress, num_cb=20, reduced_redundancy=use_rr)
उपयोग psycopg2 कॉपी आदेश तालिका लाल विचलन के लिए डेटा संलग्न करने के लिए।
sql=""" copy %s from '%s' CREDENTIALS 'aws_access_key_id=%s;aws_secret_access_key=%s' DELIMITER '%s' FORMAT CSV %s %s %s %s;""" % (opt.to_table, fn, AWS_ACCESS_KEY_ID, AWS_SECRET_ACCESS_KEY,opt.delim,quote,gzip, timeformat, ignoreheader)
- 1. BigQuery बनाम अमेज़ॅन Redshift
- 2. Redshift
- 3. MySQL से अमेज़ॅन DynamoDB
- 4. Redshift
- 5. Redshift
- 6. एसक्यूएल वर्कबेंच Redshift
- 7. RedShift/ParAccel
- 8. Redshift SQL
- 9. अमेज़ॅन ईसी 2 MySQL
- 10. aws redshift
- 11. पाइथन Boto3 के माध्यम से अमेज़ॅन Redshift में डेटा कैसे लोड करें?
- 12. अमेज़ॅन रेडशिफ्ट से इंटेलिजे को कनेक्ट करें
- 13. redshift - info_schema.columns तालिका
- 14. क्या अमेज़ॅन अरोड़ा से अमेज़ॅन आरडीएस में मूल MySQL से माइग्रेट करना संभव है?
- 15. Redshift वैक्यूम SQLWorkbenchJ
- 16. MySQL वर्कबेंच को अमेज़ॅन आरडीएस से कैसे कनेक्ट करें?
- 17. RedShift में एक चर घोषित
- 18. Redshift psql ऑटो वृद्धि भी
- 19. अज्ञात MySQL सर्वर होस्ट अमेज़ॅन आरडीएस
- 20. URL से अमेज़ॅन S3
- 21. Redshift में JSON फ़ील्ड क्वेरी करना
- 22. Redshift प्रतिलिपि बनाने का कार्य SQLAlchemy
- 23. Redshift COPY क्वेरी एक प्रकार की कुंजी
- 24. एसडीएल फ़ंक्शन जेनर_एसरीज़() का उपयोग Redshift
- 25. अमेज़ॅन आरडीएस
- 26. अमेज़ॅन आरडीएस mysqldump मुद्दे
- 27. अमेज़ॅन आरडीएस mysqldump अमेज़ॅन इको-सिस्टम
- 28. क्लाउडफ्लेयर से अमेज़ॅन एपीआई गेटवे
- 29. जावा ईई वेब ऐप के लिए अमेज़ॅन क्लाउड कॉन्फ़िगरेशन MySQL
- 30. अमेज़ॅन आरडीएस MySQL उदाहरण बहुत धीमा प्रदर्शन करता है
कृपया अपने पद, कोई समाधान नहीं है, लेकिन सिर्फ एक संदर्भ है जो बढ़ावा देने के लिए पोस्ट नहीं करें। यह एक अग्रणी पीढ़ी पोर्टल नहीं है। – lazywiz