(Why does the oozie luncher consume 2 yarn containers? के अनुसार)oozie कार्यप्रवाह
मैं 1900 कोर और 11TB रैम के साथ क्लस्टर के लिए एक आवेदन मास्टर चलाएँ। और मैं अपने Oozie WF के लिए कार्यप्रवाह के अगले संरचना है:
- लगभग 300-400 उसी संरचना है कि (कांटा नियंत्रण नोड द्वारा) समानांतर में चलेंगे
- इन subflows में साथ subworkflows एक-एक करके 2-3 घंटे (लंबी अवधि चिंगारी कार्यों)
सवाल यह है - क्या इन सबवर्कफ्लो को एकल कंटेनर (एप्लिकेशन मास्टर) में चलाने के लिए संभव है? डिफ़ॉल्ट रूप से, प्रत्येक सबवर्कफ्लो ओज़ी/यार्न के लिए दो कोर का उपयोग होता है: एक के लिए एएम और एक मानचित्र-कम करने के लिए कार्य (नियंत्रक)। और यह बाधा है - मेरे क्लस्टर के सभी कोरों में से 1/3 केवल नियंत्रित करने के लिए उपयोग किए जाते हैं, लेकिन
* "सभी कोरों में से 1/3" * - मुझे लगता है कि आप यार्न द्वारा आवंटित तार्किक "vcores" का मतलब है, वास्तविक CPU कोर नहीं। यदि आपका क्लस्टर "पूर्ण लोड" पर चलता है लेकिन वास्तविक CPU उपयोग कम है, तो आप समग्र रूप से - cf. https://hortonworks.com/blog/managing-cpu-resources-in-your-hadoop-yarn-clusters/ _ "... vcores की संख्या को व्यवस्थापक द्वारा सेट किया जाना है ... सामान्य अनुशंसा सेट करना है यह नोड पर भौतिक कोर की संख्या के लिए है, लेकिन अगर प्रशासक तेजी से CPUs के साथ नोड्स पर अतिरिक्त कंटेनर चलाने की इच्छा रखते हैं तो प्रशासक इसे टक्कर दे सकते हैं ... "_ - या यदि उनके पास बहुत सारे एएम कंटेनर हैं। –
हां, मेरा मतलब है vCores, असली CPUs नहीं –
मैं यार्न फीचर (OOZIE-1770) पर ओज़ी पर नजर रखने की भी सिफारिश करता हूं। –