2010-01-16 19 views
10

मेरे पास एक ऐसा एप्लिकेशन है जिसके लिए एकत्रीकरण के विभिन्न स्तरों के लिए विश्लेषण की आवश्यकता है, और यह ओलाप वर्कलोड है। मैं अपने डेटाबेस को भी अक्सर अद्यतन करना चाहता हूं।कोई स्केलेबल ओलाप डेटाबेस (वेब ​​ऐप स्केल)?

जैसे, यहाँ क्या मेरी अद्यतन लगता है कि (स्कीमा की तरह दिखता है: समय, गंतव्य, स्रोत आईपी, ब्राउज़र -> दौरा) है

(15:00-1-2-2010, www.stackoverflow.com, 128.19.1.1, safari) --> 105 

(15:00-1-2-2010, www.stackoverflow.com, 128.19.2.1, firefox) --> 110 

... 

(15:00-1-5-2010, www.cnn.com, 128.19.5.1, firefox) --> 110 

और फिर मैं पूछने के लिए www के लिए कुल यात्रा है क्या चाहते हैं पिछले महीने एक फ़ायरफ़ॉक्स ब्राउज़र से .stackoverflow.com।

मुझे लगता है कि वर्टिका प्रणाली अपेक्षाकृत सस्ते तरीके से प्रदर्शन कर सकती है (प्रदर्शन और मापनीयता के अनुसार, लेकिन लागत के अनुसार संभवतः नहीं)। मेरे यहां दो प्रश्न हैं।

1) क्या कोई ओपन-सोर्स उत्पाद है जिसे मैं इस समस्या को हल करने के लिए तैयार कर सकता हूं? विशेष रूप से, मोंड्रियन प्रणाली कितनी अच्छी तरह से काम करती है? (स्केलेबिलिटी, और प्रदर्शन) 2) क्या कोई एचबीएएस या हाइपरटेबल आधार समाधान है (जाहिर है, एक नग्न एचबीएस/हाइपरटेबल ऐसा नहीं कर सकता है) इसके लिए? - लेकिन अगर एचबीएएस/हाइपरटेबल पर आधारित एक परियोजना है, तो स्केलेबिलिटी शायद आईएमओ नहीं होगी)?

धन्यवाद!

+0

आपकी अपेक्षित डेटा मात्रा क्या है? 1 मिलियन हिट/दिन? एक करोड़? –

उत्तर

2

आप ग्रीनप्लम डेटाबेस का एक मुफ्त संस्करण (एकल नोड संस्करण) डाउनलोड कर सकते हैं। मैंने इसे खुद की कोशिश नहीं की है, लेकिन मुझे लगता है/अनुमान है कि यह एक शक्तिशाली जानवर है। यहां पढ़ें: http://www.dbms2.com/2009/10/19/greenplum-free-single-node-edition/

एक और विकल्प मोंगोडीबी है, यह तेज़ और नि: शुल्क है और आप एनालिटिक्स करने के लिए जावास्क्रिप्ट के साथ मैपरेडस फ़ंक्शन लिख सकते हैं।

मेरी प्रतिष्ठा यहां मोंगोडब के लिए हाइपरलिंक जोड़ने के लिए कम है, इसलिए आपको Google पर जाना होगा। मैं प्रति पोस्ट केवल एक हाइपर लिंक जोड़ सकता हूं।

+0

ग्रीनप्लम मुक्त नहीं है – charlie111

+0

एकल नोड संस्करण मुफ्त है। – AABBCCDD

+0

स्पष्टीकरण के लिए: ग्रीनप्लम एसएनई "बीयर में मुफ्त" है। आपको इसके लिए पैसे का भुगतान नहीं करना है, लेकिन आकार और सर्वरों की संख्या पर लाइसेंसिंग प्रतिबंध हैं जिन्हें आप इसे तैनात कर सकते हैं, और स्रोत कोड सार्वजनिक रूप से जारी नहीं किया गया है। – goodside

2

zohmg project का उद्देश्य हैडोप और एचबेस का उपयोग करके इस समस्या को हल करना है।

2

फेसबुक ने हाडोप के शीर्ष पर हाइव भी बनाया। जाने के लिए बहुत आसान - उचित क्वेरी एपीआई भी।

http://mirror.facebook.net/facebook/hive/

0

अपने डेटा मॉडल है कि तुलना में अधिक जटिल है? यदि ऐसा नहीं है तो आप इसके लिए कस्टम कोड लिखने के लिए शर्त लगा सकते हैं। फिर आप इसे अपने डेटा पर वास्तव में ट्यून कर सकते हैं। वास्तविक उत्पादों को बहुत लचीलापन प्रदान करना पड़ता है, इसे प्राप्त करने के लिए बहुत जटिलता की आवश्यकता होती है, और परिणामस्वरूप गति में पीड़ित होती है।

आपका प्रश्न एक पहलू में स्पष्ट नहीं है: जब आप स्केलेबल के बारे में बात करते हैं, तो इसका मतलब क्या है? क्या आप बहुत सी साइटों से डेटा एकत्र कर रहे हैं, लेकिन केवल सीमित मात्रा में क्वेरी उपयोगकर्ता हैं, या आपके पास बहुत सारे उपयोगकर्ता भी हैं? वह स्थिति एक महत्वपूर्ण मॉडल की ओर ले जाती है।

+0

मुझे यहां डेटा मॉडल के मामले नहीं दिख रहे हैं। मूल पोस्ट आदि HBase के शीर्ष और पर पहले से गणना (घनाभ lattices) के एक समाधान खोजने के लिए चाहता है आप MapReduce, जो क्या हाइव कर रही है फैली बारे में बात कर रहे हैं, लेकिन अनिवार्य रूप से यह एक बैच मोड प्रसंस्करण –

+0

है नहीं है, मैं कोड लिखने और फ्लैट फाइलों का उपयोग करने के बारे में बात कर रहा हूं।डेटा मॉडल और पाठ्यक्रम की इकाइयों की संख्या के आधार पर। –

संबंधित मुद्दे