मैं अपने शोध के लिए स्पार्क 1.4 का उपयोग कर रहा हूं और मेमोरी सेटिंग्स के साथ संघर्ष कर रहा हूं। मेरी मशीन में 16 जीबी मेमोरी है इसलिए मेरी फाइल का आकार केवल 300 एमबी है क्योंकि कोई समस्या नहीं है। हालांकि, जब मैं toPandas()
समारोह मैं निम्न त्रुटि प्राप्त का उपयोग कर पांडा dataframe को स्पार्क RDD बदलने की कोशिश:स्पार्क 1.4 बढ़ाएं maxResultSize मेमोरी
serialized results of 9 tasks (1096.9 MB) is bigger than spark.driver.maxResultSize (1024.0 MB)
मैं इस चिंगारी कॉन्फ़िग फ़ाइल बदल रहा है और अब भी वही त्रुटि हो रही है ठीक करने के लिए कोशिश की। मैंने सुना है कि यह स्पार्क 1.4 के साथ एक समस्या है और यह सोचकर कि क्या आप इसे हल करने के बारे में जानते हैं। किसी भी प्रकार की मदद की बेहद सराहना की जाती है।
मैं कॉन्फ़िग फ़ाइल में चर सेट किया था और चिंगारी लेकिन अब भी वही त्रुटि हो रही है को पुनः आरंभ दूर करने के लिए कर सकते हैं। – ahajib
क्या आपने 1 समाधान का प्रयास किया है ?? –
यह मेरे लिए काम करता है, लेकिन यह आपके जैसा उल्लेख किया गया अस्थायी समाधान होना चाहिए;) किसी भी तरह से धन्यवाद –