2015-09-11 10 views
5

मैं बड़े डेटा और Apache Spark के बारे में जानना शुरू कर रहा हूं और मुझे संदेह है।क्या मैं अपाचे स्पार्क पर टाइम सीरीज डेटाबेस (टीएसडीबी) चला सकता हूं?

भविष्य में मुझे आईओटी से डेटा एकत्र करने की आवश्यकता होगी और यह डेटा मेरे पास time series data के रूप में आएगा। मैं टाइम सीरीज़ डेटाबेस (TSDB) के बारे में पढ़ रहा था और मुझे कुछ ओपन-सोर्स विकल्प जैसे एटलस, कैरोस डीबी, ओपनटीएसबी, आदि

मुझे वास्तव में अपाचे स्पार्क की आवश्यकता है, इसलिए मैं जानना चाहता हूं: क्या मैं टाइम सीरीज़ का उपयोग कर सकता हूं अपाचे स्पार्क पर डाटाबेस? क्या यह कोई समझ में आता है? कृपया, याद रखें कि मैं बड़े डेटा, अपाचे स्पार्क और उन सभी मामलों की अवधारणाओं के लिए बहुत नया हूं जिनसे मैंने इस प्रश्न में बात की है।

यदि मैं स्पार्क पर टीएसडीबी चला सकता हूं, तो मैं इसे कैसे प्राप्त कर सकता हूं?

+0

आप के लिए, https://spark.apache.org/docs/latest/api/ पर एक नज़र में सक्षम होना चाहिए स्केला/स्वतंत्र x.html # org.apache.spark.sql.sources.package और एक कार्यान्वयन जैसे https://github.com/databricks/spark-csv/blob/master/src/main/scala/com/databricks/spark/ csv/csvRelation.scala - मुझे कोई ओपनटीएसबी जावा एपीआई नहीं मिला है, इसलिए आपको खुदाई करने की आवश्यकता हो सकती है। – Reactormonk

+0

यह एक दिलचस्प विषय है, लेकिन स्पार्क पर 'टीएसडीबी द्वारा आपका क्या मतलब है? सेंसर डेटा प्रोसेसिंग का कौन सा हिस्सा आपको डेटाबेस में और स्पार्क में कौन सा हिस्सा करने की ज़रूरत है? –

+1

मुझे सभी समय श्रृंखला को एक अच्छे डेटाबेस में स्टोर करने की आवश्यकता है और बाद में मुझे इस डेटा पर मशीन लर्निंग एल्गोरिदम का उपयोग करने के लिए स्पार्क की आवश्यकता होगी। – Paladini

उत्तर

0

मैं ओपनटीएसबी कमेंटर हूं, मुझे पता है कि यह एक पुराना सवाल है, लेकिन मैं जवाब देना चाहता था। मेरा सुझाव है कि आप अपने आने वाले डेटा को OpenTSDB पर लिखना चाहें, मान लें कि आप कच्चे डेटा को स्टोर करना चाहते हैं और बाद में इसे संसाधित करना चाहते हैं। फिर स्पार्क के साथ, OpenTSDB कक्षाओं का उपयोग करके OpenTSDB क्वेरी निष्पादित करें।

आप कक्षाओं के साथ डेटा भी लिख सकते हैं, मुझे लगता है कि आप इनकमिंगडेटाइन निर्माण का उपयोग करना चाहते हैं, मेरे पास वास्तव में इस समय विवरण नहीं है। अधिक प्रश्नों के लिए ओपनटीएसबी मेलिंग सूची पर मुझसे संपर्क करने में संकोच न करें।

आप एक देखते हैं कि कैसे OpenTSDB भेजे "डाल" अनुरोध यहाँ संभालती है, आप लेखन के लिए अपने कोड में एक ही बात करने के लिए सक्षम होना चाहिए:

https://github.com/OpenTSDB/opentsdb/blob/master/src/tsd/PutDataPointRpc.java#L42

आप OpenTSDB प्रस्तुत करने Splicer परियोजना देख सकते हैं प्रश्नों यहाँ, एक ऐसी ही विधि अपने स्पार्क परियोजना में इस्तेमाल किया जा सकता है मुझे लगता है कि:

https://github.com/turn/splicer/blob/master/src/main/java/com/turn/splicer/tsdbutils/SplicerQueryRunner.java#L87

संबंधित मुद्दे