मुझे पता है कि इस तरह के रूप में इस के लिए इसी तरह के सवाल कर रहे हैं कि:स्पष्टीकरण बनाम RabbitMQ + अजवाइन
- https://stackoverflow.com/questions/8232194/pros-and-cons-of-celery-vs-disco-vs-hadoop-vs-other-distributed-computing-packag
- Differentiate celery, kombu, PyAMQP and RabbitMQ/ironMQ
लेकिन मैं इस पूछ रहा हूँ क्योंकि मैं कुछ उपयोग-केस उदाहरणों द्वारा समर्थित एक और विशेष भेद की तलाश में हूं, कृपया।
के लिए बहुत लंबा करने के लिए
तो, मैं एक अजगर उपयोगकर्ता के लिए जो कि या तो कार्यक्रमों बनाना चाहता है/दोनों हूँ , और उन्हें कई मशीनों पर संसाधित करें। मैं अजगर में (सिंगल-मशीन) मल्टीप्रोसेसिंग पैकेज से परिचित हूं, और मैं अभी मैप्रिडस स्टाइल कोड लिखता हूं। मुझे पता है कि मेरा कार्य, उदाहरण के लिए, आसानी से समानांतर है।
मेरी हमेशा की तरह स्मार्ट सीएस सलाह-वालों से पूछ में, मैं मेरे सवाल phrased है के रूप में:
"मैं एक काम लेना चाहते हैं, यह उप-कार्य का एक समूह है कि मशीनों का एक समूह पर एक साथ क्रियान्वित कर रहे हैं में विभाजित, तो उन परिणामों को समेकित किया जाना चाहिए और कुछ अन्य कार्यों के अनुसार निपटाया जा सकता है, जो कम हो सकता है, या उदाहरण के लिए, डेटाबेस में क्रमशः जोड़ने के लिए निर्देश हो सकते हैं। "
मेरे उपयोग-मामले के इस खंड के मुताबिक, मुझे लगता है कि मैं हडोप या सेलेरी श्रमिकों + रब्बीएमक्यू ब्रोकर का एक सेट का उपयोग कर सकता हूं। हालांकि, जब मैं ऋषि सलाहकार से पूछता हूं, तो वे मुझे जवाब देते हैं जैसे कि मैं हडोप और सेलेरी को तुलनीय समाधान के रूप में देखने के लिए पूरी तरह पागल हूं। मैंने हडोप के बारे में काफी कुछ पढ़ा है, और सेलेरी के बारे में भी मुझे लगता है --- मुझे लगता है कि मुझे क्या लगता है पर मुझे बहुत अच्छा समझ है ---
- वे क्यों हैं इतना अलग माना जाता है, इतना अलग?
- यह देखते हुए कि उन्हें पूरी तरह से अलग तकनीकों के रूप में प्राप्त किया जाता है --- किस तरह से? उपयोग के मामले क्या हैं जो एक दूसरे से अलग हैं या किसी एक के लिए बेहतर हैं?
- दोनों के साथ क्या समस्याएं हल की जा सकती हैं, और एक या दूसरे का उपयोग करने के लिए विशेष रूप से कौन सा क्षेत्र विशेष रूप से मूर्ख होगा?
- मल्टीप्रोसेसिंग जैसे पूल.मैप() - एकाधिक मशीनों की कार्यक्षमता प्राप्त करने के लिए संभवतः बेहतर, सरल तरीके हैं? आइए कल्पना करें कि मेरी समस्या भंडारण द्वारा बाधित नहीं है, लेकिन सीपीयू और रैम द्वारा गणना के लिए आवश्यक है, इसलिए श्रमिकों से मिलने वाले परिणामों को पकड़ने के लिए बहुत कम जगह होने में कोई समस्या नहीं है। (यानी, मैं सिमुलेशन की तरह कुछ कर रहा हूं जहां मुझे डेटाबेस से मूल्य से बीजित छोटी मशीनों पर बहुत सी चीजें उत्पन्न करने की ज़रूरत है, लेकिन ये स्रोत मशीन/डेटाबेस पर लौटने से पहले कम हो जाते हैं।)
मुझे लगता है कि हैडोप बड़ा डेटा मानक है, लेकिन सेलेरी भी अच्छी तरह से समर्थित दिखती है; मैं सराहना करता हूं कि यह जावा नहीं है (स्ट्रीमिंग एपीआई पायथन को हडूप के लिए उपयोग करना पड़ता है जो मुझे असहज लग रहा था), इसलिए मैं सेलेरी विकल्प का उपयोग करने के इच्छुक हूं।
मैं इसकी जांच कर रहा हूं, और मेरा मानना है कि आप सही हैं, और यह बहुत उपयोगी था। ज़ीरोएमक्यू अब तक काफी अद्भुत है। यह वितरित कंप्यूटिंग और उचित संदेश रूटिंग, नेटवर्क प्रोग्रामिंग के बीच एक अजीब छिद्रपूर्ण जगह है। अभी भी इसे हल करने की कोशिश कर रहा है। – Mittenchops
मुझे ज़ीरोएमक्यू पसंद है। धन्यवाद! – Mittenchops
@Mittenchops आपको जीतने के लिए खुशी हुई। प्रारंभिक बाधा पर आने में कुछ समय लगता है, लेकिन इसके लायक है। – RickyA