हम एक माप प्रणाली का निर्माण कर रहे हैं जिसमें अंततः हजारों माप स्टेशन शामिल होंगे। प्रत्येक स्टेशन अपने जीवनकाल में लगभग 30 मिलियन मापों को बचाएगा जिसमें 30 स्केलर मूल्य होंगे। ये फ्लोट वैल्यू होंगे। अब हम प्रत्येक स्टेशन पर इस डेटा को बचाने के लिए सोच रहे हैं, हम प्रत्येक स्टेशन ऐसी है किभौतिक माप के लिए अच्छा (noSQL?) डेटाबेस
- हम एक सप्ताह के कई timescales पर डेटा (जैसे माप कल्पना करने के लिए चाहते हैं पर एक वेब एप्लिकेशन बनाने पर विचार किया जाएगा, माह, वर्ष)
- हम
- हम केवल कर रहे हैं (एक महीने से अधिक डेटा पर औसत चलती जैसे औसत एक साल ग्राफ में दिखाने के लिए)
- डेटाबेस दुर्घटना प्रतिरोधी (बिजली की कटौती होने के लिए) की जरूरत का निर्माण करने की जरूरत है लिखता है और पढ़ता है, डेटा
इसके अतिरिक्त हम एक और सर्वर चाहते हैं जो 1000 माप स्टेशनों का डेटा दिखा सकता है। यह 500 बिलियन माप में डेटा का ~ 50 टीबी होगा। माप स्टेशन से सर्वर तक डेटा संचारित करने के लिए, मैंने सोचा कि कुछ प्रकार का डेटाबेस-स्तरीय प्रतिकृति एक स्वच्छ और कुशल तरीका होगा।
अब मैं सोच रहा हूं कि इन उद्देश्यों के लिए कोई एसएसक्यूएल समाधान mySQL से बेहतर हो सकता है या नहीं। विशेष रूप से couchDB, कैसंड्रा और शायद जैसे प्रमुख मूल्य वाले स्टोर Redis मुझे आकर्षक लग रहा है। उनमें से कौन सा "माप समय श्रृंखला" डेटा मॉडल आपकी राय में सबसे अच्छा होगा? माप केंद्र से मुख्य सर्वर तक दुर्घटना सुरक्षा और प्रतिकृति जैसे अन्य फायदों के बारे में क्या?
मुझे नेटसीडीएफ भी मिला है - किसी को भी इसका अनुभव मिला है? यह समय श्रृंखला के लिए बनाया गया है, लेकिन मुझे कई सर्वरों का उपयोग करके क्रैश प्रतिरोध और स्केलिंग के बारे में निश्चित नहीं है ... – Chris