में डिजाइनिंग टाइम्सरी डेटाबेस मैं दैनिक डेटा की लाखों श्रृंखला संग्रहित करने के लिए एक कैसंद्रा टाइम्सरी डेटाबेस बनाने की सोच रहा हूं जो संभावित रूप से 100 बी डेटा पॉइंट तक हो सकता है।कैसंड्रा
मैं इस लेख को देखा: http://rubyscale.com/blog/2011/03/06/basic-time-series-with-cassandra/
इस डिजाइन बहुत आवाज़ है। इसलिए अनिवार्य रूप से मैं दैनिक टाइमस्टैम्प को कॉलम के रूप में रख सकता हूं और यदि आवश्यक हो तो दिन को पंक्ति में जोड़कर कॉलम को दाढ़ी दें।
दो सवाल मेरे पास है:
- मैं 20,000 टाइमस्टैंप (दैनिक) कॉलम तक का ही भंडारण पर देख रहा हूँ। उदाहरण के लिए पंक्तियों को छाया करना भी आवश्यक है। इस कॉलम के साथ साल? कॉलम की संख्या को प्रति वर्ष 365 तक कम करने के लिए पंक्तियों को रोकने के लिए कोई लाभ/हानि है।
- मेरे पास एक और विचार है कि पंक्तियों को कॉल करने के बजाए कॉलम परिवार को हर साल प्रति व्यक्ति बनाना है। इस तरह से कई वर्षों से डेटा तक पहुंचने पर मुझे एक कॉलम परिवार की बजाय एकाधिक कॉलम परिवारों से पूछना होगा और क्लाइंट साइड पर परिणामों में शामिल होना होगा। क्या यह दृष्टिकोण गति को चीजों को ऊपर या धीमा कर देगा?
तो आपको लगता है कि शेडिंग टेबल/कॉलम परिवारों में अलग-अलग कॉलम परिवारों में कोई अंक नहीं है बल्कि इसे पंक्तियों के बजाय करना है? क्या एक कॉलम परिवार में बहुत सारी पंक्तियां होने से कोई नुकसान होता है? – datageek
कॉलम परिवार सिर्फ एक अतिरिक्त कुंजी स्तर है।यदि मेरा डेटा एक ही प्रकृति का है और कैशिंग, तुलना (कॉलम नाम) इत्यादि के समान सेटिंग्स की आवश्यकता है, तो मैंने उन्हें उसी कॉलम परिवार में रखा है। प्लस कॉलम परिवार प्रोग्रामिक रूप से प्रबंधित करना उतना आसान नहीं हैं। जबकि एक नई कुंजी को लिखना इसे बनाएगा। और आप एक प्रश्न में अलग सीएफ से नहीं पढ़ सकते हैं। –