मैं नीचे आदेश का उपयोग स्पार्क विकास के लिए एक IPython नोटबुक लाया: ipython notebook --profile=pyspark
और मैं इस तरह अजगर कोड का उपयोग कर एक sc SparkContext बनाया: import sys
import os
os.environ[
में RDD के लिए एक सरल एक पंक्ति स्ट्रिंग में कनवर्ट करें मैं एक सरल रेखा है। मैं sc.parallelize(line)
की कोशिश की है लेकिन यह मिलती है: sc.parallelize(line).collect()
['H', 'e', 'l', 'l', 'o', ',',