वहाँ df.na().drop()
और df.filter(df.col("onlyColumnInOneColumnDataFrame").isNotNull() && !df.col("onlyColumnInOneColumnDataFrame").isNaN())
के बीच अर्थ विज्ञान में कोई अंतर है जहां df
अपाचे स्पार्कDataframe
है?अंतर। ड्रॉप() और फिल्टर (col.isNotNull) (अपाचे स्पार्क)
या मैं इसे एक बग के रूप में विचार करेगा अगर पहले एक बाद में null
वापस नहीं करता है (नहीं एक स्ट्रिंग अशक्त, लेकिन बस एक null
मूल्य) स्तंभ onlyColumnInOneColumnDataFrame
और दूसरा एक करता है?
संपादित करें: !isNaN()
भी जोड़ा गया। onlyColumnInOneColumnDataFrame
दिए गए Dataframe
में एकमात्र कॉलम है। मान लें कि इसका प्रकार Integer
है।
आपको एक उदाहरण डेटा प्रदान कर सकता है? – zero323
मैंने उन कोडों को निम्नलिखित कोड के साथ देखा है - https://gist.github.com/xjrk58/87dd094e2987ecc448db, लेकिन इसे सरल बनाने और इनपुट डेटा के साथ पुनरुत्पादित केस प्रदान करने का प्रयास करेंगे। लाइन 4 पर 'df.show()' को कॉल करने के बाद अधिक सटीक होने के लिए, कॉलम "परिभाषा आईडी" में 'शून्य' मान शामिल हैं। – JiriS