2015-11-19 2 views
6

के साथ ठीक है, हम अपने सर्वर की निगरानी के लिए रिमेंन और रिमैन-हेल्थ का उपयोग कर रहे हैं। हालांकि अब मुझे काफी सीपीयू महत्वपूर्ण चेतावनियां मिलती हैं, क्योंकि सीपीयू बहुत ही कम समय के लिए चोटी जाती है - ऐसा कुछ भी नहीं है जिसे मुझे लगता है कि मुझे लगता है। मेरी समझ से, निरंतर उच्च CPU उपयोग भार औसत बढ़ाएगा, जिसे भी रिपोर्ट किया जाएगा और ध्वनि को और अधिक उपयोगी लगता है।रिपोर्ट सीपीयू हमेशा Riemann

मैं सीपीयू की रिपोर्टिंग को अक्षम नहीं करना चाहता, बस हर स्तर को ठीक माना जाना चाहिए। यदि संभव हो, तो मैं Riemann सर्वर पर ईवेंट को बदलना चाहता हूं, इसलिए मुझे सभी सर्वरों को बदलने की ज़रूरत नहीं है।

यहाँ हमारे Riemann config: https://gist.github.com/iGEL/e352764a8c559440c851

+0

क्या आप भी रिमैन लॉग पोस्ट कर सकते हैं? –

उत्तर

0

मैं एक पूर्ण समाधान नहीं है, लेकिन सिद्धांत रूप में आप एक where समारोह के माध्यम से अपने CPU से संबंधित घटनाओं को फिल्टर करने के लिए सक्षम होना चाहिए और "ठीक है" करने के लिए बिना शर्त राज्य सेट का उपयोग कर with के रूप में इस प्रकार है:

(streams 
    (where (service #"cpu") 
     (with :state "ok" index))) 

दूसरी ओर, लोड औसत पर भरोसा एक अच्छा विचार नहीं है के बाद से एक उच्च लोड औसत भी है कि a large number of processes are waiting for IO हो सकता है।

सीपीयू अलर्ट को शांत करने के बजाय, आप केवल सतर्क हो सकते हैं अगर सीपीयू एक्स स्थिति इकाइयों से अधिक के लिए ठीक नहीं है। यहां तक ​​कि बेहतर, क्लाइंट-इफेक्टिंग समस्या का प्रतिनिधित्व करने वाले उच्च-स्तरीय मीट्रिक पर चेतावनी, जैसे प्रतिक्रिया विलंबता, http स्थिति कोड, त्रुटि स्तर इत्यादि सब के बाद, यदि CPU उच्च है, लेकिन सिस्टम पर कोई प्रभाव नहीं है, तो एक चेतावनी शायद शोर की संभावना है।

संबंधित मुद्दे