मेरे पास एक प्रणाली है जो विभिन्न स्थानों से http (> 10k उत्पादक, प्रति दिन 10 लॉग, ~ प्रत्येक पाठ की 100 पंक्तियों) के माध्यम से लॉग फ़ाइलों को प्राप्त कर रही है।कई लॉग फ़ाइलों का संग्रहण
मैं उन्हें विविध गणना करने में सक्षम होने के लिए स्टोर करना चाहता हूं। उन पर आंकड़े रात में, उन्हें निर्यात (आगमन की तारीख या पहली पंक्ति सामग्री द्वारा आदेश दिया गया) ...
मेरा सवाल है: उन्हें स्टोर करने का सबसे अच्छा तरीका क्या है?
- फ्लैट पाठ फ़ाइलों (उचित ताला के साथ), अपलोड की गई फ़ाइल प्रति एक फ़ाइल, प्रति दिन एक निर्देशिका/निर्माता
- फ्लैट पाठ फ़ाइलें, एक (बड़ा) सभी उत्पादकों के लिए प्रति दिन फ़ाइल (समस्या यहाँ अनुक्रमण हो जाएगा और लॉकिंग)
- पाठ के साथ डेटाबेस तालिका (MySQL आंतरिक कारणों से पसंद किया जाता है) (के रूप में बहुत लंबी हो सकती है को नष्ट डीबी पर्ज साथ पंजाब!)
- sharding साथ
- डाटाबेस प्रति पाठ की पंक्ति एक रिकॉर्ड (साथ डाटाबेस टेबल प्रति दिन एक टेबल), सरल डेटा शुद्ध करने की इजाजत देता है। (यह विभाजन है। हालांकि mysql के संस्करण के पास (यानी आंतरिक रूप से समर्थित) का उपयोग नहीं है)
- दस्तावेज़ आधारित डीबी à la couchdb या mongodb (समस्या इंडेक्सिंग/परिपक्वता/इंजेक्शन की गति के साथ हो सकती है)
कोई सलाह?
यह एक sys-admin प्रश्न है, जिसका अर्थ यह है कि यह बहन साइट "सर्वर फॉल्ट" serverfault.com – tylerl
पर है, वास्तव में, जो मैं पूछ रहा हूं उसका उत्तर विकास पर भारी प्रभाव डालता है – makapuf