मैं एक ओपनसीएल कर्नेल लिख रहा हूं जिसमें लूप में कुछ बाधाएं शामिल हैं। मैंने सीपीयू (8-कोर FX8150) पर कर्नेल का परीक्षण किया है और परिणाम दिखाता है कि इन बाधाओं ने 50 ~ 100 गुना के कारक द्वारा चलने वाली गति को कम किया है (मैंने इसे बहु-थ्रेडिंग + साइक्लिकबैरियर का उपयोग करके जावा पर कर्नेल को फिर से कार्यान्वित करके सत्यापित किया है) । मुझे संदेह है कि बाधा अनिवार्य रूप से सीपीयू को आउट ऑफ़ ऑर्डर निष्पादन का लाभ उठाने से रोकती है, इसलिए यदि मैं GPU पर गति घटाने की समान परिमाण का पालन करता हूं तो मैं थोड़ा चिंतित हूं। मैंने कुछ आधिकारिक दस्तावेजों की जांच की और थोड़ा सा गुगल किया लेकिन इस विषय पर बहुत कम जानकारी उपलब्ध है।क्या आधुनिक जीपीयू (जैसे फर्मि/सदाबहार) आदेश निष्पादन से बाहर है?
5
A
उत्तर
7
वर्तमान राज्य के कला GPUs में से आदेश प्रोसेसर pipelined हैं। GPUs विभिन्न warps (wavefronts) से निर्देशों को interleaving द्वारा पाइपलाइन प्रभावी ढंग से भरें। तुलना में, सीपीयू पाइपलाइन को भरने के लिए आउट ऑफ़ ऑर्डर सट्टा निष्पादन का उपयोग करते हैं। एएलयू और एसएफयू जैसी विभिन्न कार्यात्मक इकाइयां हैं जो पाइपलाइनों को अलग करती हैं। लेकिन ध्यान दें कि निर्देश निर्भरता वार्प को रोकती है। जीपीयू पर संकल्प निर्भरता निर्भरता के बारे में अधिक जानकारी के लिए this NVIDIA patent देखें।
2
NVIDIA के अगली पीढ़ी
CUDA कंप्यूट और ग्राफिक्स आर्किटेक्चर, कोड नाम "फर्मी":
Nvidia GigaThread Engine स्विचिंग (पेज 5 पर)
- 10x तेजी से आवेदन संदर्भ से क्षमता है
- समवर्ती कर्नेल निष्पादन
- ऑर्डर थ्रेड ब्लॉक निष्पादन से बाहर :)
- दोहरी ओवरलैप स्मृति हस्तांतरण इंजन
संबंधित मुद्दे
- 1. ऑर्डर निष्पादन और मेमोरी बाड़ से बाहर
- 2. न्यूटिट में निष्पादन का आदेश क्या है?
- 3. निष्पादन आदेश
- 4. एएसपी.Net निष्पादन आदेश
- 5. Parallel.ForEach आदेश दिया निष्पादन
- 6. ग्रैडल डूफर्स्ट() निष्पादन आदेश
- 7. Drupal hook_cron निष्पादन आदेश
- 8. hook_preprocess_node() निष्पादन आदेश
- 9. माइस्क्ल: जैसे आदेश?
- 10. एक्शन फ़िल्टर निष्पादन आदेश
- 11. बढ़ावा :: थ्रेड निष्पादन आदेश
- 12. एचटीएमएल पार्स आदेश/स्क्रिप्ट निष्पादन आदेश
- 13. सी # निर्माता निष्पादन आदेश
- 14. जीपीयू
- 15. हास्केल में आदेश से बाहर निकलना
- 16. रिक्त लाइनों: बाहर आदेश
- 17. निष्पादन के बाद बाहर निकलने से जीनोम टर्मिनल को रोकें
- 18. जावास्क्रिप्ट ईवेंट हैंडलर्स निष्पादन आदेश
- 19. धागे के निष्पादन आदेश को अप्रत्याशित बनाता है क्या?
- 20. dispatch_async बनाम dispatch_sync निष्पादन आदेश
- 21. कठपुतली नोड्स.पीपी मॉड्यूल निष्पादन आदेश
- 22. जीपीयू
- 23. जीपीयू
- 24. संग्रहित प्रक्रिया - मजबूर कर निष्पादन आदेश
- 25. क्या आधुनिक लिनक्स
- 26. जीपीयू
- 27. जीपीयू
- 28. आर में, बाकी के निष्पादन किए बिना फ़ंक्शन से बाहर कूदने के लिए कीवर्ड क्या है?
- 29. Mysql + Django अपवाद: "आदेश सिंक्रनाइज़ेशन से बाहर है, आप इस आदेश को अब नहीं चल सकता"
- 30. जीपीयू डिंटरटरिंग
इसके बारे में जानकारी है। आपको कोड के माध्यम से समय-समय पर एफपीयू गणना अलग-अलग विभाजित करनी चाहिए, इसलिए यह पूर्णांक कैल्क कर सकता है। एक ही समय में तैरते हुए –
@ tuğrulbüyükışık धन्यवाद। क्या आप मुझे एक आधिकारिक दस्तावेज पर इंगित कर सकते हैं जो इसकी पुष्टि करता है (संदर्भ उद्देश्य के लिए)? – aaronqli