आम तौर पर यह आपके उपयोग के मामले, जरूरतों आदि पर निर्भर करता है ... लेकिन मैं आपके द्वारा साझा की गई जानकारी पर विचार करने के लिए न्यूनतम कॉन्फ़िगरेशन का सुझाव दे सकता हूं।
आप डेटा के 2 ~ 4 GB का बीच मैट्रिक्स पर एक ALS
गुणन या SVD
प्रशिक्षित करने के लिए कोशिश कर रहे हैं। तो वास्तव में यह बहुत अधिक डेटा नहीं है।
आपको एक छोटे वितरित क्लस्टर को सेटअप और कॉन्फ़िगर करने के लिए कम से कम 1 मास्टर और 2 नोड्स की आवश्यकता होगी। मास्टर किसी भी कंप्यूटिंग को नहीं कर पाएगा, इसलिए उसे अधिक संसाधनों की आवश्यकता नहीं होगी, लेकिन निश्चित रूप से मैं कार्य शेड्यूलिंग आदि से निपट रहा हूं,
आप अपनी आवश्यकताओं के अनुसार दास (उदाहरण) जोड़ सकते हैं।
1 x master : m3.xlarge - vCPU : 4 , RAM : 15 GB and 2 x 40 GB SSDs
2 x slaves : c3.4xlarge - vCPU : 16, RAM : 30 GB and 2 x 160GB SSDs.
सी 3 और सी 4 गणना उच्च प्रदर्शन प्रोसेसर की विशेषता उदाहरणों अनुकूलित कर रहे हैं और हालांकि यह उपयोग के मामलों अनुशंसा की जाती है R3 की तुलना में EC2 में सबसे कम कीमत/गणना प्रदर्शन के साथ स्मृति कैश वितरित किया गया और इन-स्मृति एनालिटिक्स कर रहे हैं। लेकिन सी 4 कम कीमत के लिए आपके लिए नौकरी करेगा।
प्रदर्शन अनुकूलन:
प्रति घंटा वेतन वृद्धि पर अमेज़न ईएमआर शुल्क नहीं। इसका मतलब है कि जब आप क्लस्टर चलाते हैं, तो आप पूरे घंटे के लिए भुगतान कर रहे हैं। यह याद रखना महत्वपूर्ण है क्योंकि यदि आप अमेज़ॅन ईएमआर क्लस्टर के पूर्ण घंटे के लिए भुगतान कर रहे हैं, तो मिनटों के मामले में आपके डेटा प्रोसेसिंग समय में सुधार करना आपके समय और प्रयास के लायक नहीं हो सकता है।
यह न भूलें कि प्रदर्शन बढ़ाने के लिए और नोड जोड़ने से आपके क्लस्टर को अनुकूलित करने में समय व्यतीत करना सस्ता है।
संदर्भ: Amazon EMR Best Practices - Parviz Deyhim।
संपादित करें: आप भी अपने क्लस्टर संसाधनों की निगरानी के लिए Ganglia सक्षम करना चाहेंगे: सीपीयू, रैम, नेटवर्क I/O। यह आपको अपने ईएमआर क्लस्टर को ट्यून करने में भी मदद करेगा। व्यावहारिक रूप से, आपके पास करने के लिए कोई विन्यास नहीं है। सृजन पर अपने ईएमआर क्लस्टर में जोड़ने के लिए बस documentation का पालन करें।
यह आपके उपयोग के मामले, जरूरतों आदि पर निर्भर करता है ... (काफी राय आधारित क्यूए) – eliasah
बस उदाहरण के लिए , क्या होगा यदि मैं कई लाख प्रविष्टियों के साथ मैट्रिक्स पर एएलएस कारककरण या एसवीडी को प्रशिक्षित करने जा रहा हूं? – shihpeng
आपका डेटा किस आकार का है? गीगाबाइट्स में? – eliasah