मैं अपने इनपुट डेटा लेने के लिए कोशिश कर रहा हूँ:स्पार्क: dataframe में कॉलम जोड़ें सशर्त
A B C
--------------
4 blah 2
2 3
56 foo 3
और पर कि क्या बी खाली है या नहीं आधारित समाप्त करने के लिए एक कॉलम जोड़ें:
A B C D
--------------------
4 blah 2 1
2 3 0
56 foo 3 1
मैं एक इनपुट तालिका के रूप में इनपुट डेटाफ्रेम को पंजीकृत करके आसानी से ऐसा कर सकते हैं, फिर एक SQL क्वेरी टाइप कर सकते हैं।
लेकिन मैं वास्तव में यह जानना चाहता हूं कि स्कैला विधियों के साथ ऐसा कैसे करें और स्कैला के भीतर SQL क्वेरी टाइप न करें।
मैंने .withColumn
की कोशिश की है, लेकिन मैं इसे जो भी करना चाहता हूं उसे प्राप्त नहीं कर सकता।
प्रश्न को फिर से पढ़ना चाहेंगे यह वही है जो मैं ढूंढ रहा था। मैंने 'कब' और 'अन्यथा' के साथ दो अलग-अलग चीजों की कोशिश की लेकिन मुझे लगता है कि मुझे सही प्रारूप गलत हो रहा था। थोड़ा सा विषय बंद करें, लेकिन क्या आप जानते हैं कि स्पार्क कॉलम के साथ कैसे काम करता है? जैसे, अगर मैं ~ 20 कॉलम जोड़ रहा हूं, तो 20 करना होगा। साथ ही कॉलम और इसे डेटाफ्रेम रखें या इसे आरडीडी में मैप करें और बस उन्हें मानचित्र में जोड़ें और फिर लकड़ी की छत पर सहेजने के लिए डेटाफ्रेम में कनवर्ट करें ? – mcmcmc
बस पाया [यह] (http://stackoverflow.com/questions/33826495/spark-scala-2-10-tuple-limit)। मुझे लगता है कि यूडीएफ जो मैं ढूंढ रहा हूं। – mcmcmc
यूडीएफ मैं नीचे भी बात कर रहा था ... –