मेरे पास स्पार्क नौकरी है जो एक स्रोत तालिका पढ़ती है, कई नक्शा/फ़्लैटन/संचालन को कम करती है और फिर परिणाम को एक अलग तालिका में संग्रहीत करती है जिसका हम रिपोर्टिंग के लिए उपयोग करते हैं। वर्तमान में यह नौकरी spark-submit
स्क्रिप्ट का उपयोग कर मैन्युअल रूप से चलाया जाता है। मैं इसे हर रात चलाने के लिए शेड्यूल करना चाहता हूं ताकि परिणाम दिन की शुरुआत के लिए पूर्व-आबादी वाले हों। क्या मैं:अनुसूचित स्पार्क नौकरी चलाना
spark-submit
स्क्रिप्ट को कॉल करने के लिए क्रॉन नौकरी सेट अप करें?- मेरी नौकरी कक्षा में शेड्यूलिंग जोड़ें, ताकि यह एक बार सबमिट किया जाए लेकिन हर रात कार्रवाई करता है?
- क्या स्पार्क में एक अंतर्निहित तंत्र है या एक अलग लिपि है जो मुझे ऐसा करने में मदद करेगी?
हम स्टैंडअलोन मोड में स्पार्क चला रहे हैं।
किसी भी सुझाव की सराहना की!
'cron' मेरे लिए काफी उचित लगता है। – maasg
http://bytepadding.com/big-data/spark/how-to-submit-spark-job-through-oozie/ ओज़ी के माध्यम से नौकरी कैसे सबमिट करें। – KrazyGautam