समस्या पैदा होती है जब मैं एक DataFrame पर describe
फ़ंक्शन को कॉल करें:स्पार्क 1.6: छानने का वर्णन (द्वारा उत्पन्न DataFrames)
val statsDF = myDataFrame.describe()
समारोह का वर्णन कॉलिंग निम्नलिखित उत्पादन पैदावार:
statsDF: org.apache.spark.sql.DataFrame = [summary: string, count: string]
मैं दिखा सकते हैं statsDF
सामान्यतः statsDF.show()
+-------+------------------+
|summary| count|
+-------+------------------+
| count| 53173|
| mean|104.76128862392568|
| stddev|3577.8184333911513|
| min| 1|
| max| 558407|
+-------+------------------+
मैं statsDF
से मानक विचलन और मतलब पाने के लिए अब चाहते हैं, लेकिन जब मैं की तरह कुछ करने से मान एकत्र करने के कोशिश कर रहा हूँ:
val temp = statsDF.where($"summary" === "stddev").collect()
मैं Task not serializable
अपवाद हो रही है।
मैं भी यही अपवाद का सामना करना पड़ रहा है जब मैं फोन:
statsDF.where($"summary" === "stddev").show()
ऐसा लगता है कि हम describe()
समारोह द्वारा उत्पन्न DataFrames फ़िल्टर नहीं कर सकते?
मैं इसे वोट दे रहा हूं। यह अजीब है कि अब – eliasah