मुझे अपने स्पार्क नौकरी के शफल चरण के दौरान "बहुत सारी खुली फाइलें" मिलती हैं। मेरी नौकरी इतनी सारी फाइलें क्यों खोल रही है? मेरी नौकरी सफल होने की कोशिश करने के लिए मैं क्या कदम उठा सकता हूं।स्पार्क नौकरी "बहुत सारी खुली फाइलों" के साथ क्यों विफल हो जाती है?
उत्तर
This has been answered on the spark user list:
सबसे अच्छा तरीका है निश्चित रूप से सिर्फ ulimit यदि संभव हो तो बढ़ाने के लिए है, इस धारणा हम स्पार्क कि समूहों यह चारों ओर ले जाने के लिए सक्षम होंगे में बनाने की तरह है।
आप रेड्यूसर [या प्रत्येक नोड द्वारा उपयोग किए जाने वाले कोर] की संख्या को कम करके इस पर हैक करने में सक्षम हो सकते हैं लेकिन इससे आपके नौकरी के लिए कुछ प्रदर्शन प्रभाव हो सकते हैं।
सामान्य रूप से यदि आपके क्लस्टर में नोड ने सी को असाइन किया है और आप एक्स रेड्यूसर के साथ एक नौकरी चलाते हैं तो स्पार्क समानांतर में सी * एक्स फ़ाइलों को खोल देगा और लेखन शुरू करेगा। शफल समेकन कुल बनाई गई फ़ाइलों की संख्या को कम करने में मदद करेगा, लेकिन समय पर फ़ाइल हैंडल खोलने की संख्या बदलती नहीं है, इसलिए यह उलटी समस्या में मदद नहीं करेगा।
-पैट्रिक वेंडेल
डिफ़ॉल्ट ulimit 1024 जो बड़े पैमाने पर अनुप्रयोगों के लिए हास्यास्पद कम है। एचबीएएस 64 के लिए सिफारिश करता है; आधुनिक लिनक्स सिस्टम को इस खुली फ़ाइलों के साथ परेशानी नहीं लगती है।
उपयोग
ulimit -a
खुली फ़ाइलों के अपने वर्तमान अधिकतम संख्या को देखने के लिए
ulimit -n
अस्थायी रूप से खुली फ़ाइलों की संख्या बदल सकते हैं; आपको यह स्थायी बनाने के लिए सिस्टम कॉन्फ़िगरेशन फ़ाइलों और प्रति-उपयोगकर्ता सीमाओं को अद्यतन करने की आवश्यकता है। रेडहाट सिस्टम पर, यह
/etc/sysctl.conf
/etc/security/limits.conf
- 1. IOException: बहुत सारी खुली फ़ाइलें
- 2. IOError: [Errno 24] बहुत सारी खुली फ़ाइलें:
- 3. जेट्टी IOException: बहुत सारी खुली फ़ाइलें
- 4. IntelliJ बहुत सारी फाइलें खुली त्रुटि
- 5. जेडीके 1.7: पॉज़िक्स सेमफोरस के कारण "बहुत सारी खुली फ़ाइलें"?
- 6. जावा वीएम "बहुत सारी खुली फाइलें" त्रुटियों के बाद क्यों ठीक नहीं होता है?
- 7. पॉलीगॉन छेड़छाड़ विफल हो जाती है, टकराव "आकार" बहुत बड़ा
- 8. सॉकेट स्वीकार करते हैं - "बहुत सारी खुली फ़ाइलें"
- 9. स्पार्क नौकरी क्या है?
- 10. NumPy और memmap: [Errno 24] बहुत सारी खुली फ़ाइलें
- 11. स्पार्क स्ट्रीमिंग में निष्पादकों को नौकरी कैसे सौंपी जाती है?
- 12. बिल्ला बहुत सारी फ़ाइलें
- 13. जावा बहुत खुली फ़ाइलें
- 14. मुझे पेपरक्लिप से "बहुत सारी खुली फ़ाइलें - कन्वर्ट" त्रुटि क्यों मिल रही है?
- 15. आईओएस/आईफोन पर: "बहुत सारी खुली फाइलें": खुली फ़ाइलों को सूचीबद्ध करने की आवश्यकता है (जैसे lsof)
- 16. बांस: अगर नौकरी रद्द हो जाती है या
- 17. मेरा जावा समय तुलना क्यों विफल हो जाती है?
- 18. यह रंग तुलना क्यों विफल हो जाती है?
- 19. यह तारीख पार्सिंग क्यों विफल हो जाती है?
- 20. सॉर्ट द्वारा परिवर्तन स्पार्क नौकरी क्यों ट्रिगर करता है?
- 21. आप हडसन में "बहुत सारी खुली फाइलें" समस्या को कैसे ठीक करते हैं?
- 22. यार्क स्पार्क नौकरी
- 23. कुबर्नेट्स - बताएं कि जब नौकरी पूर्ण हो जाती है
- 24. बहुत सारी अस्थायी छोटी फ़ाइलों को संभालना
- 25. एंड्रॉइड में बहुत सारी गतिविधियां?
- 26. php-fpm बहुत खुली फ़ाइलें
- 27. क्यों, max_dbs_open बढ़ाने के बाद, प्रतिकृतियां अभी भी "max_dbs_open बढ़ाएं" के साथ विफल हो जाती हैं?
- 28. ईबीन कई बहुत सारी क्वेरी
- 29. त्रुटि java.net.SocketException को हल करने के लिए कैसे करें: बहुत सारी खुली फ़ाइलें
- 30. अनुसूचित स्पार्क नौकरी चलाना
मैंने सोचा था कि स्पार्क के प्राथमिक लाभों में से एक यह चीजों को रैम में रखता है .. फिर उसे इतनी सारी फाइलें क्यों खोलनी पड़ेगी? – anthonybell
यह शफ़ल के दौरान उन फ़ाइलों का उपयोग करता है। विचार यह है कि स्थानीय डिस्क पर प्रत्येक रेड्यूसर के लिए डेटा को पहले चरणबद्ध करना है, फिर reducer डेटा को अपनी गति से (पुश के बजाय खींचें) का उपभोग कर सकता है। – marios
बस किसी और को मेसो का उपयोग करके एक ही समस्या में कदम उठाने के मामले में, उसी स्पार्क उपयोगकर्ता सूची थ्रेड को उद्धृत करते हुए: "यह पता चला है कि मेसो ओएस ulimit -n सेटिंग को ओवरराइट कर सकता है। इसलिए हमने मेसोस गुलाम ulimit -n सेटिंग में वृद्धि की है। " – vefthym