मैं जब .select()
का उपयोग कर एक आश्चर्य की बात व्यवहार में भाग:वास्तव में क्या करता है। चयन करें() करें?
>>> my_df.show()
+---+---+---+
| a| b| c|
+---+---+---+
| 1| 3| 5|
| 2| 4| 6|
+---+---+---+
>>> a_c = s_df.select(col("a"), col("c")) # removing column b
>>> a_c.show()
+---+---+
| a| c|
+---+---+
| 1| 5|
| 2| 6|
+---+---+
>>> a_c.filter(col("b") == 3).show() # I can still filter on "b"!
+---+---+
| a| c|
+---+---+
| 1| 5|
+---+---+
यह व्यवहार मिला मेरी सोच ... मेरे निम्नलिखित बातों पर सही हैं?
डेटाफ्रेम केवल विचार हैं, एक साधारण डेटाफ्रेम स्वयं का एक दृश्य है। मेरे मामले में a_c
सिर्फ my_df
में एक दृश्य है।
जब मैंने a_c
बनाया कोई नया डेटा नहीं बनाया गया था, a_c
केवल उसी डेटा पर इंगित कर रहा है my_df
इंगित कर रहा है।
यदि अतिरिक्त जानकारी है जो प्रासंगिक है, तो कृपया जोड़ें!
चरणों समझा बिना के रूप में @Chris एच –
मुझे लगता है कि ने सुझाव दिया जवाब अद्यतन इस व्याख्या क्या वास्तव में हो रहा है के मांस का अभाव है –
@ JustinPihony- मुझे लगता है कि मंच इस मामले में पर्याप्त तर्क नहीं है। –