मैं जानता हूँ कि यह टैग है स्काला, लेकिन सिर्फ मामले में अजगर के पक्ष में जोड़ने के लिए किसी को भी उत्सुक है। RDD बनाएँ और बचाने के रूप में है
rdd_of_tuples = sc.parallelize([('one',1),('two',2)])
rdd_of_tuples.saveAsTextFile('/user/cloudera/rdd_of_tuples')
यह इस तरह पंक्तियों की बचत होगी के रूप में आप का उल्लेख
('one', 1)
लेकिन यह
rdd_of_text = rdd_of_tuples.map(lambda (x,y): x + ',' + str(y)).saveAsTextFile('/user/cloudera/rdd_of_text')
काम करना चाहिए और अगर आप मिलना चाहिए
one,1
ध्यान दें कि इस विशेष मामले में आप श्रृंखलाबद्ध के लिए प्रकार के बारे में पता होना करने के लिए (str जाँच (जरूरत है यदि आप निम्न कार्य वाई)), अन्यथा आपको निम्नलिखित अपवाद
TypeError: cannot concatenate 'str' and 'int' objects
@ आशीष यदि आपके पास कोई टिप्पणी है, तो कृपया टिप्पणी बॉक्स का उपयोग करें और उत्तर संपादित न करें! साथ ही आपके द्वारा संपादित किए गए कोड को यहां प्रश्न से संबंधित नहीं है। आपका कोड आरडीडी [पंक्ति] के साथ काम कर रहा है जो यहां मामला नहीं है। – eliasah