मैं वास्तव में कुछ ऐसा करने में SQL सर्वर बनाने के लिए संघर्ष कर रहा हूं, जो स्पष्ट रूप से कभी नहीं होगा। मुझे अपने विश्लेषणात्मक काम के लिए डेटाबेस इंजन की आवश्यकता है। डीबी को तेज़ होने की आवश्यकता है और सामान्य डेटाबेस (SQL सर्वर, ओरेकल, डीबी 2, आदि) में पाए गए सभी लॉगिंग और अन्य ओवरहेड की आवश्यकता नहीं हैकॉलम स्टोर: कॉलम आधारित डेटाबेस की तुलना
कल मैंने Michael Stonebraker speak at the Money:Tech conference की बात सुनी और मैंने सोचा, "मैं नहीं हूं वास्तव में पागल। एक बेहतर तरीका है! " वह पंक्ति उन्मुख डेटाबेस के बजाय column stores का उपयोग करने के बारे में बात करता है। मैं column stores के लिए विकिपीडिया पेज पर गया और मुझे कुछ ओपन सोर्स प्रोजेक्ट्स (जो मुझे पसंद है) और कुछ वाणिज्यिक/ओपन सोर्स प्रोजेक्ट्स (जो मैं पूरी तरह समझ नहीं पा रहा हूं) देखता हूं।
मेरा प्रश्न यह है: एक लागू विश्लेषणात्मक वातावरण में, अलग-अलग स्तंभ आधारित डीबी अलग-अलग कैसे होते हैं? मुझे उनके बारे में कैसे सोचना चाहिए? किसी के पास एकाधिक कॉलम आधारित सिस्टम के साथ व्यावहारिक अनुभव है? क्या मैं इन डीबी के साथ अपने एसक्यूएल अनुभव का लाभ उठा सकता हूं या क्या मुझे एक नई भाषा सीखनी है?
मैं अंततः विश्लेषण के लिए आर में डेटा खींच रहा हूं।
संपादित करें: मुझे कुछ स्पष्टीकरण के लिए अनुरोध किया गया था कि मैं वास्तव में क्या करने की कोशिश कर रहा हूं। तो, यहां एक उदाहरण दिया गया है कि मैं क्या करना चाहता हूं: ऐसी तालिका बनाएं जिसमें 4 मिलियन पंक्तियां और 20 कॉलम हों (5 dims, 15 तथ्यों)। 5 समेकन सारणी बनाएं जो प्रत्येक तथ्यों के लिए अधिकतम, न्यूनतम और औसत की गणना करें। शुरुआती तालिका में उन 5 समेकन में शामिल हों। अब औसत से प्रतिशत विचलन, न्यूनतम का विचलन, और प्रत्येक पंक्ति के लिए अधिकतम से प्रतिशत विचलन की गणना करें और इसे मूल तालिका में जोड़ें। इस तालिका डेटा को हर दिन नई पंक्तियां नहीं मिलती हैं, यह पूरी तरह से बदल जाती है और प्रक्रिया दोहराई जाती है। अगर प्रक्रिया को रोका जाना चाहिए तो स्वर्ग मना कर दें। और लॉग ... ओह, लॉग! :)
लुसीडडीबी के लिए ईटीएल उपकरण का उपयोग करना सबसे आसान क्या है? केटल? –
जेडी, क्या आपने आखिरकार ल्यूसिड डीबी को आर से कोशिश की है? क्या आरजेडीबीसी रास्ता लुसीडडीबी के साथ सहजता से काम करता है? अपने अनुभव को जानना चाहते हैं। –
मैंने यहां विभिन्न स्तंभ उन्मुख डेटाबेस की तुलना लिखी है: http://www.timestored.com/time-series-data/column-oriented- डेटाबेस –