मैं वितरित कोड में प्रवेश करना शुरू कर रहा हूं और मुझे यह पता लगाने में परेशानी हो रही है कि कौन सा समाधान वहां मौजूद सभी सामानों के आधार पर मेरी आवश्यकताओं को फिट करता है। असल में मेरे पास डेटा की एक पायथन सूची है जिसे मुझे एक ही फ़ंक्शन के साथ संसाधित करने की आवश्यकता है। इस फ़ंक्शन में लूप के लिए कुछ घोंसला है लेकिन सूची में प्रत्येक आइटम के लिए बहुत लंबा (लगभग एक मिनट) नहीं लगता है। मेरी समस्या यह है कि सूची बहुत बड़ी है (3000+ आइटम)। मैं मल्टीप्रोसेसिंग देख रहा हूं लेकिन मुझे लगता है कि मैं बहु-सर्वर प्रसंस्करण के साथ प्रयोग करना चाहता हूं (क्योंकि आदर्श रूप से, यदि डेटा बड़ा हो जाता है तो मैं नौकरी के दौरान इसे अधिक तेज़ी से चलाने के लिए अधिक सर्वर जोड़ने की पसंद प्राप्त करना चाहता हूं) ।कार्यकर्ता नोड्स पर पायथन डेटा/कोड वितरित करने पर सुझाव?
मैं मूल रूप से कुछ है कि मैं के माध्यम से इस डेटा सूची वितरित कर सकते हैं की तलाश में (सुपर जरूरत नहीं और लेकिन यह अच्छा होगा अगर मैं भी इस के माध्यम से अपने कोड बेस वितरित कर सकता है)
तो मेरे सवाल है, क्या पैकेज कर सकते हैं मैं इसे प्राप्त करने के लिए उपयोग करते हैं? मेरा डेटाबेस hbase है इसलिए मेरे पास पहले से ही हैडऑप चल रहा है (हालांकि कभी भी डेटाबेस के लिए इसका उपयोग नहीं किया गया था)। मैंने अजवाइन को देखा और साथ ही मुड़ दिया लेकिन मैं उलझन में हूं जिस पर मेरी ज़रूरतें पूरी होंगी।
कोई सुझाव?