आप दो अलग-अलग चीजों की तुलना कर रहे हैं। अपाचे स्पार्क एक गणना इंजन है, जबकि आपके द्वारा वर्णित अमेज़ॅन और माइक्रोसॉफ्ट समाधान सेवाएं प्रदान कर रहे हैं। इन सेवाओं के साथ दृश्य के पीछे एमएलआईबीबी के साथ स्पार्क भी हो सकता है। वे आपको एक वेब सेवा बनाने में परेशानी से बचाते हैं, लेकिन आप अतिरिक्त भुगतान करते हैं।
कंपनियों की संख्या, डोमिनोज़ डाटा लैब, क्लाउडेरा या आईबीएम की पेशकश उत्पादों की तरह है कि आप अपने खुद के स्पार्क क्लस्टर पर तैनात और आसानी से अपने मॉडलों के आसपास सेवा का निर्माण (लचीलापन के विभिन्न डिग्री के साथ) कर सकते हैं।
स्वाभाविक रूप से आप विभिन्न खुले स्रोत उपकरण के साथ एक सेवा अपने आप का निर्माण। कौन सा विशेष रूप से? यह सब इस बात पर निर्भर करता है कि आप क्या कर रहे हैं। मॉडल को मॉडल के साथ कैसे बातचीत करनी चाहिए? क्या कुछ प्रकार का यूआई होना चाहिए या एक आरईएसटी एपीई जेस्ट होना चाहिए? क्या आपको मॉडल या मॉडल पर कुछ पैरामीटर बदलने की ज़रूरत है? क्या नौकरियां बैच या रीयल-टाइम प्रकृति के अधिक हैं? आप स्वाभाविक रूप से सभी में एक समाधान बना सकते हैं, लेकिन यह एक बड़ा प्रयास होगा।
मेरा व्यक्तिगत सिफारिश अमेज़न, गूगल, माइक्रोसॉफ्ट या जो कुछ भी से उपलब्ध सेवाओं में से एक का,, लाभ लेने के लिए है, तो आप कर सकते हैं होगा। ऑन-प्रिमाइसेस परिनियोजन की आवश्यकता है? डोमिनोज़ डेटा लैब की जांच करें, उनका उत्पाद परिपक्व है और मॉडलों के साथ आसान काम करने की अनुमति देता है (तैनाती तक इमारत से)। क्लौडेरा क्लस्टर कंप्यूटिंग (स्पार्क समेत) पर अधिक केंद्रित है, लेकिन कुछ परिपक्व होने से पहले इसमें कुछ समय लगेगा।
[संपादित करें] मैं Apache PredictionIO, ओपन सोर्स मशीन लर्निंग सर्वर - बहुत सारी संभावनाओं के साथ अद्भुत परियोजना पर एक नज़र डालने की सिफारिश करता हूं।
स्रोत
2016-11-10 20:18:19
मैं स्पार्क-जॉब्सर्वर को मौका दूंगा। आप एक मॉडल (एक पूर्ण स्पार्क पाइपलाइन भी) को आसानी से और जल्दी से एमएल - वर्गीकरण या प्रश्नों जैसे प्रासंगिक प्रश्नों को कैश कर सकते हैं। यह आपको समेकित तालिकाओं को कैश करने का मौका भी देता है और किसी अन्य एप्लिकेशन में विज़ुअलाइज़ेशन या आगे की प्रोसेसिंग के लिए इस डेटा या उसके हिस्सों वाले जेसन को तुरंत वापस लौटाता है। –