मैं एक पुनरावृत्ति गणना के परिणाम एकत्र करने के लिए एक आरडीडी बनाना चाहता हूं।एक पुनरावृत्ति गणना के परिणाम एकत्र करने के लिए आरडीडी बनाना
मैं एक पाश (या किसी भी वैकल्पिक) का उपयोग कर सकते कैसे निम्नलिखित कोड को बदलने के लिए:
import org.apache.spark.mllib.random.RandomRDDs._
val n = 10
val step1 = normalRDD(sc, n, seed = 1)
val step2 = normalRDD(sc, n, seed = (step1.max).toLong)
val result1 = step1.zip(step2)
val step3 = normalRDD(sc, n, seed = (step2.max).toLong)
val result2 = result1.zip(step3)
...
val step50 = normalRDD(sc, n, seed = (step49.max).toLong)
val result49 = result48.zip(step50)
(एन कदम RDDs बनाने और अंत में एक साथ तो ज़िप करने भी लंबे 50 RDDs के रूप में ठीक हो जाएगा बीज = सम्मान करने के लिए बनाई गई हैं iteratively (चरण (n-1) .max) हालत)
मैं scalaz से Stream.unfold' प्रयोग करेंगे 'एक उत्पन्न करने के लिए चरणों की धारा, और फिर इसे ज़िप अपने और/या स्कैनराइट के साथ .. – Reactormonk