Apache Beam अपाचे स्पार्क और फ्लिंक सहित कई धावक बैकएंड का समर्थन करता है। मैं स्पार्क/फ्लिंक से परिचित हूं और मैं बैच प्रोसेसिंग के लिए बीम के पेशेवरों/विपक्ष को देखने की कोशिश कर रहा हूं।बैच प्रोसेसिंग के लिए स्पार्क/फ्लिंक पर अपाचे बीम के क्या फायदे हैं?
Beam word count example पर देखकर, ऐसा लगता है कि यह मूल स्पार्क/फ्लिंक समकक्षों के समान ही है, शायद थोड़ा और वर्बोज सिंटैक्स के साथ।
मुझे वर्तमान में इस तरह के कार्य के लिए स्पार्क/फ्लिंक पर बीम चुनने का बड़ा लाभ नहीं दिख रहा है। केवल एक ही अवलोकन जो मैं अब तक कर सकता हूं:
- प्रो: विभिन्न निष्पादन बैकएंड पर एब्स्ट्रक्शन।
- कॉन: यह अमूर्त स्पार्क/फ्लिंक में वास्तव में निष्पादित किए जाने पर कम नियंत्रण रखने की कीमत पर आता है।
क्या बेहतर उदाहरण हैं जो बीम मॉडल के अन्य पेशेवरों/विपक्ष को उजागर करते हैं? क्या नियंत्रण की हानि प्रदर्शन को प्रभावित करती है इस बारे में कोई जानकारी है?
ध्यान दें कि मैं स्ट्रीमिंग पहलुओं में अंतर की मांग नहीं कर रहा हूं, जो आंशिक रूप से this question में शामिल हैं और this article (स्पार्क 1.X के कारण पुराना) में संक्षेप में सारांशित हैं।