कैसे OpenCL Vulkan से संबंधित है?
वे दोनों पाइपलाइन GPU और कतारों का उपयोग कर की मेजबानी के लिए GPU के लिए मेजबान से एक वियोज्य काम एक से अधिक थ्रेड का उपयोग कर संचार भूमि के ऊपर कम करने के लिए कर सकते हैं। डायरेक्टएक्स-ओपनएल नहीं कर सकता?
ओपनसीएल: आरंभिक रिलीज 28 अगस्त, 200 9। व्यापक हार्डवेयर समर्थन। पॉइंटर्स की अनुमति है लेकिन डिवाइस में केवल इस्तेमाल किया जा सकता है। आप धागे के बीच साझा स्थानीय स्मृति का उपयोग कर सकते हैं। एक हैलो दुनिया शुरू करना बहुत आसान है। आदेशों के लिए एपीआई ओवरहेड है जब तक कि वे डिवाइस-साइड कतारबद्ध न हों। आप निहित बहु-डिवाइस सिंक्रनाइज़ेशन या स्पष्ट प्रबंधन चुन सकते हैं। बग ज्यादातर 1.2 के लिए तय किए जाते हैं लेकिन मुझे संस्करण 2.0 के बारे में पता नहीं है।
वल्कन: प्रारंभिक रिलीज 16 फरवरी 2016 (लेकिन 2014 से प्रगति)। संकुचित हार्डवेयर समर्थन। एसपीआईआर-वी हैंडल पॉइंटर्स कर सकते हैं? शायद नहीं? कोई स्थानीय-स्मृति विकल्प नहीं है? हैलो दुनिया शुरू करना मुश्किल है। कम एपीआई ओवरहेड। क्या आप निहित बहु-डिवाइस प्रबंधन चुन सकते हैं? दोटा -2 गेम और कुछ अन्य गेम के लिए अभी भी छोटी गाड़ी। एक ही समय में ग्राफिक्स और गणना पाइपलाइन दोनों का उपयोग करके और भी विलंबता छिप सकती है।
यदि ओपनक्ल में वल्कन था, तो यह 7-9 वर्षों के लिए जनता से छिपा हुआ है। वे इसे जोड़ सकते हैं, तो क्यों वे इसे ओपन के लिए (PhysX/CUDA द्वारा दबाव की शायद क्योंकि?) नहीं किया?
Vulkan, दोनों एक गणना और ग्राफिक्स एपीआई रूप में विज्ञापित है लेकिन मैं बहुत कम पाया गणना भाग के लिए संसाधन - वह क्यों है?
इसे ओपनक्ल की तरह अधिक समय की आवश्यकता है।
https://www.khronos.org/registry/vulkan/specs/1.0/xhtml/vkspec.html#fundamentals-floatingpoint
यहाँ गणना shaders द्वारा प्रबंधित कण प्रणाली का एक उदाहरण है:
आप गणना shaders यहाँ aboout जानकारी की जांच कर सकते
https://github.com/SaschaWillems/Vulkan/tree/master/computeparticles
कि नीचे
, वहाँ raytracers कर रहे हैं और छवि प्रसंस्करण उदाहरण भी।
वल्कन ओपनजीएल पर एक प्रदर्शन लाभ है। वल्कन बनाम ओपनसीएल के लिए भी यही सच है?
- Vulkan एक और एपीआई के लिए सिंक्रनाइज़ करने की आवश्यकता नहीं है। कमांडक्यू के बीच कमांड बफर सिंक्रनाइज़ेशन के बारे में।
- ओपनसीएल को साझा बफर (क्ल-ग्ल या डीएक्स-सीएल इंटरऑप बफर) का उपयोग करने से पहले ओपनजीएल या डायरेक्टएक्स (या वल्कन?) के साथ सिंक्रनाइज़ करने की आवश्यकता है। इसमें एक ओवरहेड है और आपको बफर स्वैपिंग और पाइपलाइनिंग का उपयोग करके इसे छिपाने की जरूरत है। यदि कोई साझा बफर मौजूद नहीं है, तो यह आधुनिक हार्डवेयर पर ओपनगल या डायरेक्टएक्स के साथ एक साथ चल सकता है।
OpenCL उदासी अपनी परिपक्व और चुनौतियों CUDA CUDA
यह था की तुलना में धीमी होने के कुख्यात है, लेकिन अब, विशेष रूप से संस्करण 2.1 का उपयोग कर FPGAs के लिए सभी गेमिंग GPUs से बहुत व्यापक हार्डवेयर समर्थन के साथ, जैसे कि भविष्य में इंटेल एक कोर i3 में एक fpga डाल सकता है और इसे (सॉफ्ट-x86 कोर आईपी) के लिए सक्षम बनाता है, कई कोर सीपीयू मॉडल एक जीपीयू प्रदर्शन और सीपीयू के बीच के अंतर को बंद करने के लिए अपने सीपीयू-फिजिक्स गेमिंग अनुभव को अपग्रेड करने या बस एक ओपनक्ल भौतिकी कार्यान्वयन इसे आकार देता है और सॉफ्ट-कोर के% 10-% 20 प्रभावी ढंग से उपयोग किए जाने वाले क्षेत्र के बजाय कम से कम% 90 मरने वाले क्षेत्र का उपयोग करता है।
उसी कीमत के साथ, एएमडी जीपीएस ओपनक्ल पर तेजी से गणना कर सकता है और उसी गणना शक्ति के साथ इंटेल इगपस कम शक्ति खींच सकता है।
इसके अलावा, मैंने एक एसजीईएमएम ओपनक्ल कर्नेल लिखा और 1.1 टीफ्लोप्स पर एचडी 7870 पर चलाया और इंटरनेट की जांच की, फिर सीयूडीएएम पर एक लोकप्रिय शीर्षक का उपयोग करके एक ही प्रदर्शन के लिए जीटीएक्स 680 पर एसजीईएमएम हेन्मार्क चिह्नित किया! (Gtx680/hd7870 का मूल्य अनुपात 2 था)।
क्या SYCL आंतरिक रूप से ओपनसीएल का उपयोग करता है या क्या यह वल्कन का उपयोग कर सकता है? या यह न तो उपयोग करता है और इसके बजाय निम्न स्तर पर निर्भर करता है, पर विक्रेता विशिष्ट एपीआई लागू किया जाना चाहिए?
यहाँ,
https://www.khronos.org/assets/uploads/developers/library/2015-iwocl/Khronos-SYCL-May15.pdf
कहते
लक्ष्य के साथ काम कर कि OpenCL की जरूरत नहीं है के लिए प्रदान करता है तरीकों (अभी तक!)
एक fallback सीपीयू कार्यान्वयन डीबग करने योग्य है !
तो यह एक शुद्ध थ्रेडेड संस्करण (जावा के अपारपी के समान) पर वापस आ सकता है। SYCL वस्तुओं से OpenCL वस्तु से SYCL वस्तुओं का निर्माण कर सकते हैं
OpenCL वस्तुओं का उपयोग कर सकते हैं
ओपन के साथ Interop SYCL में रहता है - (शायद ही संरचनाओं/प्रकार
यह OpenCL का उपयोग करता है का उपयोग करता है सीधे नहीं, लेकिन एक अपग्रेड किए गए ड्राइवर संचार के साथ?), यह ओपनक्ल के समानांतर विकसित करता है लेकिन धागे पर गिर सकता है।
छोटी से छोटी OpenCL 1.2 एम्बेडेड डिवाइस से
सबसे उन्नत OpenCL 2.2 त्वरक
"ओपनसीएल सीयूडीए से धीमे होने के लिए दुखद रूप से कुख्यात है"। किसके अनुसार? –