क्या मैपरेडस (Google, हैडोप) के लिए कोई वैकल्पिक प्रतिमान है? & को विभाजित करने के लिए कोई अन्य उचित तरीका क्या है बड़ी समस्याएं?MapReduce विकल्प
उत्तर
निश्चित रूप से। उदाहरण के लिए, Bulk Synchronous Parallel देखें। मानचित्र/घटा वास्तव में समस्याओं को कम करने का एक बहुत ही सीमित तरीका है, हालांकि प्रतिबंध यह हैडोप जैसे ढांचे में प्रबंधनीय बनाता है। सवाल यह है कि यदि आपकी समस्या को मानचित्र/कम करने की सेटिंग में दबाएं, या यदि डोमेन-विशिष्ट समांतरता योजना बनाना आसान है और सभी कार्यान्वयन विवरणों का ख्याल रखना आसान है। वास्तव में, सुअर, हडोप के शीर्ष पर केवल एक अमूर्त परत है जो मैप-रेडस-वाई से मैप-रेडस-संगत तक कई मानक समस्या परिवर्तनों को स्वचालित करता है।
संपादित 26.1.13: मिले एक nice up-to-date overview here
[अपाचे हामा] (http://incubator.apache.org/hama/) बीएसपी लागू करता है। हामा को [यार्न (फिर भी एक अन्य संसाधन प्रबंधक)] (http://wiki.apache.org/hama/GettingStartedYARN) पर भेज दिया गया है जो हडोप 0.23 का हिस्सा है। अपाचे हामा पर यह [ब्लॉग] (http://codingwiththomas.blogspot.com/) देखें। –
धन्यवाद प्रवीण;) कृपया हमारे वेबसाइट और विकी पर जाएं http://amaubator.apache.org/hama/ –
फिल Colella पहचान वैज्ञानिक गणना के लिए सात संख्यात्मक तरीके बिखरने और प्रसंस्करण नोड्स के बीच डेटा की सभा के पैटर्न पर आधारित है, और उन्हें कहा जाता है 'बौने'। ये दूसरों के द्वारा करने के लिए जोड़ा गया है, एक सूची Dwarf Mine पर उपलब्ध है:
- घने रेखीय बीजगणित
- विरल रेखीय बीजगणित
- स्पेक्ट्रल तरीके
- एन शारीरिक तरीके
- संरचित ग्रिड
- अनियंत्रित ग्रिड
- मैपराइडस
- कॉम्बिनेशन लॉगी ग
- ग्राफ़ Traversal
- गतिशील प्रोग्रामिंग
- पीछे और शाखा-और-बाउंड
- ग्राफिकल मॉडल
- परिमित अवस्था की मशीनों
माइक्रोसॉफ्ट के Dryad MapReduce से अधिक सामान्य होने का दावा किया है।
अपडेट (अगस्त 2014): स्ट्रैटोस्फीयर को अब Apache Flink (सेते हुए) कहा जाता है।
Stratosphere पर एक नज़र डालें। यह एक और बड़ा डेटा रनटाइम है जो अधिक ऑपरेटरों (मानचित्र, कमी, जुड़ना, संघ, क्रॉस, पुनरावृत्त, ...) प्रदान करता है। यह उन्नत डेटा फ्लो ग्राफ को परिभाषित करने की अनुमति देता है (हैडोप एमआर के साथ, आपको चेन जॉब्स करना होगा)।
स्ट्रेटोस्फीयर भी अपने ग्राफ प्रोसेसिंग अबास्ट्रक्शन (Spargel कहा जाता है) के साथ बीएसपी का समर्थन करता है।
यदि आप वैज्ञानिक कागजात पढ़ना चाहते हैं, तो Nephele/PACTs: A Programming Model and Execution Framework for Web-Scale Analytical Processing पर एक नज़र डालें, यह सिस्टम की सैद्धांतिक पृष्ठभूमि बताती है।
क्षेत्र में एक और प्रणाली Spark है जिसका अपना मॉडल (आरडीडी) है। चूंकि बीएसपी का उल्लेख यहां किया गया है, इसलिए GraphLab पर भी एक नज़र डालें, यह पेशकश बसपा के लिए एक विकल्प है।
- 1. MapReduce
- 2. MapReduce
- 3. MapReduce
- 4. लोचदार MapReduce
- 5. MapReduce/Hadoop
- 6. अमेज़ॅन लोचदार MapReduce - SIGTERM
- 7. MongoDB MapReduce PHP
- 8. सिस्टम से Hbase MapReduce
- 9. MapReduce रैखिक प्रोग्रामिंग
- 10. Hadoop MapReduce काम इनपुट
- 11. MongoDB: mapReduce दुष्प्रभाव
- 12. हडोप में त्रुटि MapReduce
- 13. MongoDB: भयानक MapReduce प्रदर्शन
- 14. Hadoop mapreduce है त्रुटि
- 15. फास्ट फूरियर MapReduce
- 16. "Combiner" एक mapreduce काम
- 17. MapReduce मेरे लिए सही है?
- 18. स्प्रिंगबैच में MapReduce/कुल संचालन
- 19. अमेज़ॅन MapReduce कोई reducer नौकरी
- 20. Hadoop mapreduce: एक MapReduce काम के भीतर मानचित्रकारों चेनिंग के लिए ड्राइवर
- 21. MapReduce परिणाम 100 तक सीमित लगते हैं?
- 22. MongoDB MapReduce स्थान पर अपडेट करें
- 23. क्या GPUs (CUDA) पर MapReduce कार्यान्वयन हैं?
- 24. MapReduce सॉर्ट एल्गोरिदम कैसे काम करता है?
- 25. वितरित स्थानीय क्लस्टरिंग गुणांक एल्गोरिदम (MapReduce/Hadoop)
- 26. MapReduce में sqoop जेनरेट क्लास का उपयोग कैसे करें?
- 27. `var विकल्प = विकल्प || के बीच अंतर {} `और` विकल्प || (विकल्प = {}) `
- 28. विकल्प? (डब्ल्यूसीएफ विकल्प)
- 29. बूस्ट प्रोग्राम विकल्प विकल्प
- 30. .NET लेनदेन विकल्प विकल्प
MapReduce एल्गोरिदम या प्रतिमान नहीं है, यह तकनीक है। –
@ralu: बड़ी समस्याओं से निपटने के कई तरीके हैं।MapReduce निश्चित रूप से उनमें से केवल एक है और यह निश्चित रूप से दोनों प्रतिमान और एल्गोरिदम है। इसके अलावा इसका कार्यान्वयन प्रौद्योगिकी बन जाता है, लेकिन मुझे कार्यान्वयन के बजाय विचारों में दिलचस्पी नहीं है। धन्यवाद। – Cartesius00
विभाजन और विलय के रूप में आप अपनी समस्या के बारे में क्यों सोचते हैं। आपको बस समस्या हल करने की जरूरत है। उदाहरण के लिए अपाचे पिग भाषा की तरह एसक्यूएल का उपयोग करके श्वेत डेटा का लेनदेन करता है। और सोचने का कोई विभाजन और विलय तरीका नहीं है हालांकि यह सैकड़ों मशीनों के समूह पर चल सकता है और हडोप को मंच के रूप में उपयोग करता है। –