2010-04-09 11 views
5

तो यह नई अच्छी चीज है, ये नोएसक्यूएल-डेटाबेस। और इसलिए मेरा डेटा है: मौसम संबंधी डेटा की पंक्तियों की पंक्तियों की पंक्तियां: एक निश्चित समय पर एक निश्चित स्टेशन (कुछ डब्लूएमओ संख्या द्वारा पहचाना गया, निर्देशांक नहीं) पर कुछ माप का प्रतिनिधित्व करने वाले मान।नोएसक्यूएल और मौसम संबंधी डेटा

प्रत्येक स्टेशन प्रत्येक पैरामीटर को मापता नहीं है, हर पैरामीटर हर समय मापा जाता है।

मैं वर्तमान में MySQL में इस डेटा (घंटे के मूल्यों के 30 साल के मूल्य, जिसके परिणामस्वरूप ~ 1 बिलियन मूल्य) संग्रहीत करता हूं। निरंतर वृद्धि और और भी डेटा के जबरदस्त जोड़ से मुझे थोड़ा सिरदर्द मिलता है।

दस्तावेज़ आधारित नोएसक्यूएल सिस्टम के बारे में पढ़ना जो आसानी से स्केल प्रतीत होता है, मैं सोच रहा था कि नोएसक्यूएल मौसम संबंधी डेटा के लिए एक व्यवहार्य डेटा स्टोरेज अवधारणा भी है। क्या आपके पास इसका कोई अनुभव है?

अद्यतन: सामान्य प्रश्नों के बारे में भूल गए: अधिकांश प्रश्नों को अस्थायी अक्ष में डेटा की आवश्यकता है: I.e. मुझे 01.01.2010 00:00 से 01.03.2010 00:00 तक स्टेशन 066310 का तापमान दें।

या: मुझे किसी विशेष स्टेशन के सभी मानकों का नवीनतम मूल्य दें।

+0

क्या हम वास्तव में जानना चाहते हैं कि हम आपके सवाल का जवाब देने में सक्षम होना चाहिए की जरूरत है आप अपने डेटा कैसे उपयोग कर रहे हैं। आप इस पर किस प्रकार के प्रश्न चलाते हैं। – adamse

+0

आह, मैं भूल गया। धन्यवाद, मैंने दो नमूने जोड़े हैं। –

+0

आपको सिरदर्द क्या दे रहा है? डेटाबेस का प्रबंधन? प्रदर्शन? डेटा एकत्रित करना? कुछ और? यदि इसके प्रदर्शन से संबंधित है, तो आपने अपने प्रश्नों के लिए क्वेरी प्लान का विश्लेषण किया है - शायद आपको बेहतर इंडेक्स की आवश्यकता है, या अपनी डेटाबेस सेटिंग्स को ट्यून करने के लिए (PostgreSQL इस पर बहुत अच्छा है)। आपका डेटासेट कितना बड़ा है - डिस्क के अनुसार। 1GB? अधिक? कम? – Mike

उत्तर

2

नोएसक्यूएल एक फिट हो सकता है जब आपकी डेटा संरचना काफी सरल होती है (उदाहरण के लिए एक साधारण कुंजी-मूल्य स्टोर)/अनुमानित और आपको अखंडता या विज्ञापन-प्रसार और/या उन्नत क्वेरीिंग की आवश्यकता नहीं है।

आप आसानी से स्केलेबिलिटी में क्या जीतते हैं, हालांकि आप लचीलापन और स्थिरता में खो सकते हैं।

सबसे बड़ी समस्या आपके डेटा पर जटिल प्रश्नों को लिखने का एक आसान माध्यम होगा। मैं कहूंगा कि मीटरोलॉजिकल डेटा नोएसक्यूएल के लिए सबसे अच्छा उम्मीदवार नहीं है।

मैं व्यक्तिगत रूप से MySQL पर PostgreSQL पसंद करता हूं और सही ढंग से सेटअप करते समय इसे बहुत स्केलेबल (यहां तक ​​कि लाखों या यहां तक ​​कि अरबों पंक्तियों के साथ) भी ढूंढता हूं।

+0

यह पूरी तरह से सही नहीं है। NoSQL बहुत जटिल डेटा भी फिट कर सकता है, उदाहरण के लिए ग्राफ डेटाबेस सोचें। फिर सरल कुंजी-मूल्य NoSQL डेटास्टोर भी है। NoSQL समाधान की एक बहुत विस्तृत विविधता है। – adamse

+0

@adamse: NoSQL शब्द की व्यापकता के बारे में अच्छा बिंदु, हालांकि मुझे लगता है कि ग्राफ डेटाबेस डेटा के लिए सबसे अच्छा फिट नहीं होगा ;-) – ChristopheD

+0

नहीं, जाहिर है नहीं :) – adamse

1

मुझे लगता है कि आपको SQL के साथ छोड़ने से पहले पूर्ण-विशेषीकृत और परिपक्व डीबीएमएस के साथ प्रयास करना चाहिए।

उदाहरण के लिए देखें:

http://www.yafla.com/dforbes/Getting_Real_about_NoSQL_and_the_SQL_Performance_Lie/

http://www.yafla.com/dforbes/The_Impact_of_SSDs_on_Database_Performance_and_the_Performance_Paradox_of_Data_Explodification/

1

मैं इसे कठिन अभी एक सुसंगत उत्तर बनाने के लिए लगता है, लेकिन यहाँ जाता है।

  1. आपका डाटा ऐसे कैसेंड्रा (और कई और अधिक शायद)
  2. आप कई "NoSQL" समाधान के स्कीमा-कम डिजाइन से लाभ होगा के रूप में एक "NoSQL" डेटासंग्रह में समस्या के बिना फिट (देखकर के रूप में बिल्कुल नहीं कॉलम (एक MySQL शब्द का उपयोग करने के लिए) हर समय मौजूद होते हैं)
  3. समय आधारित प्रश्नों को कैसंद्रा में कोई समस्या नहीं होगी (टाइमयूयूआईडी आधारित कुंजी देखें)
  4. आप संबंधपरक हिस्से का लाभ नहीं ले रहे हैं MySQL का, इसलिए इसे खोने पर आपको इतना नुकसान नहीं होगा
  5. हालांकि आप हो सकते हैं MySQL के साथ बस ठीक है, क्योंकि आप वास्तव में समस्याओं की तरह वर्णन नहीं कर रहे हैं, क्या आप वास्तव में कोई हैं?(बस दिलचस्पी लेना पूरी तरह से ठंडा है)
  6. इंडेक्स और खोज जैसी चीजें हैं जो आपको कई nosql डेटास्टोर में मैन्युअल रूप से कार्यान्वित करने के लिए होती हैं, अगर यह डर लगता है कि आप शायद एसक्यूएल के साथ चिपके रहें।

सुनने के लिए धन्यवाद;)

+0

मुझे कैसंद्रा पर एक नज़र डालेंगी। इनपुट के लिए धन्यवाद। –

संबंधित मुद्दे