क्या कई बार dataFrame.withColumnRenamed()
पर कॉल करने के बजाय दिए गए स्पार्कएसक्यूएल DataFrame
के एक ही समय में सभी या एकाधिक कॉलम का उपसर्ग या नाम बदलने का कोई अच्छा तरीका है?स्पार्क डेटाफ्रेम और कई कॉलम का नाम बदलना (जावा)
एक उदाहरण होगा यदि मैं परिवर्तनों का पता लगाना चाहता हूं (पूर्ण बाहरी शामिल होने का उपयोग कर)। तब मुझे एक ही संरचना के साथ दो DataFrame
एस के साथ छोड़ दिया गया है।
यह जावा एपीआई और स्पार्क के बारे में अधिक है। एक उदाहरण के रूप में 'चयन' या तो एक स्ट्रिंग पैरामीटर की अपेक्षा करता है और उसके बाद 'कॉलम' के varargs या सरणी जो संगत नहीं है और कभी-कभी उपयोग करने के लिए थोड़ा परेशान भी होती है। मुझे इस समस्या से निपटने के लिए कुछ सहायक तरीके बनाना पड़ा, लेकिन उन तरीकों को सीधे 'डेटाफ्रेम' में उपलब्ध करना बेहतर होगा। – JiriS
एक और उदाहरण है [यहां] (http://stackoverflow.com/questions/32535273/how-to-match-dataframe-column-names-to-scala-case-class-attributes) –
क्या आपने अपना कोड आजमाया स्पार्क 2.0? मैं 7000 कॉलम से निपट रहा हूं, https://github.com/ramhiser/datamicroarray/wiki/Golub-(1999 देखें)। यह हमेशा के लिए लेता है (= मेरे धैर्य खत्म होने से पहले कभी खत्म नहीं हुआ)। – Boern