मैं बड़े डेटा और Apache Spark के बारे में जानना शुरू कर रहा हूं और मुझे संदेह है।क्या मैं अपाचे स्पार्क पर टाइम सीरीज डेटाबेस (टीएसडीबी) चला सकता हूं?
भविष्य में मुझे आईओटी से डेटा एकत्र करने की आवश्यकता होगी और यह डेटा मेरे पास time series data के रूप में आएगा। मैं टाइम सीरीज़ डेटाबेस (TSDB) के बारे में पढ़ रहा था और मुझे कुछ ओपन-सोर्स विकल्प जैसे एटलस, कैरोस डीबी, ओपनटीएसबी, आदि
मुझे वास्तव में अपाचे स्पार्क की आवश्यकता है, इसलिए मैं जानना चाहता हूं: क्या मैं टाइम सीरीज़ का उपयोग कर सकता हूं अपाचे स्पार्क पर डाटाबेस? क्या यह कोई समझ में आता है? कृपया, याद रखें कि मैं बड़े डेटा, अपाचे स्पार्क और उन सभी मामलों की अवधारणाओं के लिए बहुत नया हूं जिनसे मैंने इस प्रश्न में बात की है।
यदि मैं स्पार्क पर टीएसडीबी चला सकता हूं, तो मैं इसे कैसे प्राप्त कर सकता हूं?
आप के लिए, https://spark.apache.org/docs/latest/api/ पर एक नज़र में सक्षम होना चाहिए स्केला/स्वतंत्र x.html # org.apache.spark.sql.sources.package और एक कार्यान्वयन जैसे https://github.com/databricks/spark-csv/blob/master/src/main/scala/com/databricks/spark/ csv/csvRelation.scala - मुझे कोई ओपनटीएसबी जावा एपीआई नहीं मिला है, इसलिए आपको खुदाई करने की आवश्यकता हो सकती है। – Reactormonk
यह एक दिलचस्प विषय है, लेकिन स्पार्क पर 'टीएसडीबी द्वारा आपका क्या मतलब है? सेंसर डेटा प्रोसेसिंग का कौन सा हिस्सा आपको डेटाबेस में और स्पार्क में कौन सा हिस्सा करने की ज़रूरत है? –
मुझे सभी समय श्रृंखला को एक अच्छे डेटाबेस में स्टोर करने की आवश्यकता है और बाद में मुझे इस डेटा पर मशीन लर्निंग एल्गोरिदम का उपयोग करने के लिए स्पार्क की आवश्यकता होगी। – Paladini