2015-10-22 24 views
9

में कनवर्ट करना मेरे पास टुपल्स, (स्ट्रिंग, स्ट्रिंग, इंट, डबल) की एक सूची है जिसे मैं स्पार्क आरडीडी में परिवर्तित करना चाहता हूं।एक स्कैला Iterable [tuple] को RDD

सामान्य रूप से, मैं एक स्पार्क आरडीडी में स्कैला इटेरेबल [(ए 1, ए 2, ए 3, ..., ए)] कैसे परिवर्तित करूं?

उत्तर

8

ऐसा करने के लिए कुछ तरीके हैं, लेकिन सबसे स्ट्रेट आगे रास्ता सिर्फ स्पार्क संदर्भ का उपयोग करना है:

import org.apache.spark._ 
import org.apache.spark.rdd._ 
import org.apache.spark.SparkContext._ 

sc.parallelize(YourIterable.toList) 

मैं sc.Parallelize सूची में रूपांतरण की आवश्यकता है, लेकिन यह आपके संरचना सुरक्षित करेगा , इस प्रकार आपको अभी भी एक आरडीडी [स्ट्रिंग, स्ट्रिंग, इंट, डबल]

+1

sc.parallelize (MyIterable.toSeq) भी काम करेगा – menorah84

संबंधित मुद्दे