स्पार्क 2.0.1 के साथ शुरू हो रहा है मुझे कुछ प्रश्न हैं। मैं प्रलेखन का एक बहुत पढ़ा लेकिन अभी तक पर्याप्त उत्तर नहीं मिल सके:स्पार्क 2.0 डेटासेट बनाम डेटाफ्रेम
- क्या
df.select("foo")
df.select($"foo")
- के बीच अंतर है मैं सही ढंग से समझ कर कि
myDataSet.map(foo.someVal)
टाइपएफ़ और वाई हैRDD
में परिवर्तित नहीं होगा, लेकिन डेटासेट प्रतिनिधित्व/कोई अतिरिक्त ओवरहेड (2.0.0 के लिए प्रदर्शन के अनुसार प्रदर्शन)
- अन्य सभी आदेश उदा। चयन करें, .. सिर्फ वाक्य रचनात्मक चीनी हैं। वे टाइपएफ़ नहीं हैं और इसके बजाय मानचित्र का उपयोग किया जा सकता है। मैप स्टेटमेंट के बिना मैं
df.select("foo")
टाइप-सुरक्षित कैसे कर सकता हूं?- मुझे नक्शा के बजाय यूडीएफ/यूएडीएफ का उपयोग क्यों करना चाहिए (मानते हुए नक्शा डेटासेट प्रतिनिधित्व में रहता है)?
एक परियोजना है कि जबकि कुशल निष्पादन पथ पर रहने स्पार्क के लिए अधिक प्रकार सुरक्षा प्रदान करना है नहीं है ] (https://github.com/typelevel/frameless) –