6

के साथ पुनरारंभ करना क्या पॉड स्थिति की निगरानी करने और स्टैकड्राइवर के साथ जीकेई क्लस्टर में चल रहे फली की गिनती को फिर से शुरू करने का कोई तरीका है?पॉड स्थिति पर निगरानी और चेतावनी देना या Google कंटेनर इंजन (जीकेई) और स्टैकड्राइवर

जबकि मैं स्टैकड्राइवर में सभी फली के लिए सीपीयू, मेमोरी और डिस्क उपयोग मीट्रिक देख सकता हूं, वहां दुर्घटनाओं के कारण पुन: प्रारंभ होने वाले प्रतिकृति सेट में पॉड्स या फली को क्रैश करने के बारे में मीट्रिक प्राप्त करने का कोई तरीका नहीं लगता है।

मैं फली का प्रबंधन करने के लिए कुबेरनेट प्रतिकृति सेट का उपयोग कर रहा हूं, इसलिए उन्हें दुर्घटनाग्रस्त होने पर नए नाम के साथ श्वसन और बनाया जाता है। जहां तक ​​मैं स्टैकड्राइवर में मेट्रिक्स को बता सकता हूं कि पॉड-नाम (जो कि फली के जीवनकाल के लिए अद्वितीय है) द्वारा दिखाई देता है जो वास्तव में समझदार नहीं लगता है।

पॉड असफलताओं पर चेतावनी ऐसी प्राकृतिक चीज़ की तरह लगती है कि यह विश्वास करना मुश्किल लगता है कि इस समय यह समर्थित नहीं है। Google कंटेनर इंजन के लिए स्टैकड्राइवर से प्राप्त होने वाली निगरानी और चेतावनी क्षमताओं के रूप में वे खड़े हो जाते हैं क्योंकि वे सभी ऐसे फोड से बंधे हैं जिनके जीवनकाल बहुत कम हो सकते हैं।

तो यदि यह बॉक्स से बाहर काम नहीं करता है तो लगातार क्रैशिंग फली के लिए निगरानी करने के तरीके पर वर्कअराउंड या सर्वोत्तम प्रथाएं ज्ञात हैं?

+0

मैं एक समान समाधान पर भी काम कर रहा हूं .. इस समय मुझे आपके द्वारा पूछे जाने वाले और अन्य समान मेट्रिक्स के बारे में बहुत कुछ नहीं मिला जो दिलचस्प हो सकता है .. अगर मेरे पास कुछ अपडेट हैं तो मैं आपको बता दूंगा! –

उत्तर

2

मेरी क्लस्टर में (एक नंगे धातु k8s क्लस्टर), मैं Kube राज्य-मीट्रिक https://github.com/kubernetes/kube-state-metrics का उपयोग आप क्या चाहते हैं क्या करना है। यह प्रोजेक्ट कुबेरनेट रेपो से संबंधित है और इसका उपयोग करना काफी आसान है। एक बार तैनात किए जाने के बाद आप इस मेट्रिक्स को kube_pod_container_status_restarts का उपयोग कर सकते हैं यह जानने के लिए कि कोई कंटेनर

संबंधित मुद्दे