मैंने स्पार्क और फ्लिंक के-साधन एप्लिकेशन का निर्माण किया है। मेरा टेस्ट केस 3 नोड क्लस्टर पर 1 मिलियन अंक पर क्लस्टरिंग है।स्पार्क बनाम फ्लिंक कम मेमोरी उपलब्ध
जब मेमोरी बाधाएं शुरू होती हैं, तो फ्लिंक डिस्क पर आउटसोर्स करना शुरू कर देता है और धीरे-धीरे काम करता है लेकिन काम करता है। हालांकि, अगर स्मृति पूर्ण हो जाती है और फिर से शुरू होती है (अनंत लूप?) स्पार्क निष्पादकों को खो देता है।
मैं मेलिंग सूची से सहायता के साथ मेमोरी सेटिंग को कस्टमाइज़ करने का प्रयास करता हूं, धन्यवाद। लेकिन स्पार्क अभी भी काम नहीं करता है।
क्या कोई कॉन्फ़िगरेशन सेट करना आवश्यक है? मेरा मतलब है कि फ्लिंक कम मेमोरी के साथ काम करता है, स्पार्क भी सक्षम होना चाहिए; या नहीं?
स्पार्क डिस्क पर डेटा को क्रमबद्ध कर सकता है लेकिन कुछ हिस्सों के लिए जेवीएम के ढेर पर डेटा के कुछ हिस्सों की आवश्यकता होती है। यदि ढेर का आकार पर्याप्त नहीं है, तो नौकरी आउटऑफमेमरी एरर के साथ मर जाती है। इसके विपरीत, फ्लिंक का इंजन ढेर पर बहुत सारी वस्तुओं को जमा नहीं करता है बल्कि उन्हें समर्पित मेमोरी क्षेत्र में संग्रहीत करता है। सभी ऑपरेटरों को इस तरह से लागू किया जाता है कि वे बहुत कम स्मृति से निपट सकते हैं और डिस्क तक फैल सकते हैं। यह [ब्लॉग पोस्ट] (http://flink.apache.org/news/2015/05/11/Juggling-with- बिट्स-and-Bytes.html) फ्लिंक के मेमोरी प्रबंधन पर चर्चा करता है और यह बाइनरी डेटा पर कैसा चल रहा है। –