मैं स्पार्क में निष्पादक स्मृति और ड्राइवर स्मृति से निपटने के बारे में उलझन में हूं।स्पार्क में एक्जिक्यूटर मेमोरी और ड्राइवर मेमोरी से कैसे निपटें?
मेरे पर्यावरण सेटिंग्स के रूप में नीचे हैं:
- मेमोरी 128 जी, के लिए 9 वी एम
- Centos 16 सीपीयू
- Hadoop 2.5.0-cdh5.2.0
- स्पार्क 1.1.0
इनपुट डेटा जानकारी:
-
HDFS
से
spark-submit
साथ फांसी दे दी। अब मैं निष्पादन ट्यूनिंग के लिए एक्जिक्यूटर मेमोरी या ड्राइवर मेमोरी सेट करना चाहता हूं। Spark documentation से, निष्पादक स्मृति के लिए परिभाषा स्मृति के
राशि निष्पादक प्रक्रिया के अनुसार उपयोग करने के लिए, JVM स्मृति तारों के रूप में एक ही प्रारूप (जैसे 512M, 2 जी) में है।
ड्राइवर स्मृति के बारे में कैसे?