मैं थोड़ा सा Google हूं, लेकिन यह अब मुझे स्पष्ट नहीं है कि क्या सीयूडीए के साथ प्रोग्राम किए गए कुछ जीपीयू लाभ ले सकते हैं या एसएसई सिम एक्सटेंशन से संबंधित निर्देशों का उपयोग कर सकते हैं; उदाहरण के लिए कि क्या हम डबल परिशुद्धता में फ्लोट के दो वैक्टरों को जोड़ सकते हैं, प्रत्येक में 4 मान हैं। यदि ऐसा है, तो मुझे आश्चर्य है कि वेक्टर के पिछले 4 मानों में से प्रत्येक के लिए अधिक हल्का धागे का उपयोग करना बेहतर होगा या सिमड का उपयोग करना बेहतर होगा।क्या सीयूडीए सिम एक्सटेंशन का उपयोग कर सकता है?
उत्तर
CUDA प्रोग्राम PTX instruction set पर संकलित करते हैं। उस निर्देश सेट में सिम निर्देश नहीं हैं। इसलिए, सीयूडीए कार्यक्रम सिम के स्पष्ट उपयोग नहीं कर सकते हैं।
हालांकि, सीयूडीए का पूरा विचार एक बड़े पैमाने पर सिम करना है। व्यक्तिगत धागे वार्प्स नामक समूहों का हिस्सा होते हैं, जिसके भीतर प्रत्येक थ्रेड निर्देशों के बिल्कुल समान अनुक्रम निष्पादित करता है (हालांकि कुछ निर्देशों को कुछ थ्रेड के लिए दबाया जा सकता है, जिससे विभिन्न निष्पादन अनुक्रमों का भ्रम हो सकता है)। एनवीडिया इसे एकल निर्देश, एकाधिक थ्रेड (सिम) कहते हैं, लेकिन यह अनिवार्य रूप से सिम है।
PTX 3.0 पर CUDA थ्रेड पर सिम निर्देशों का उपयोग किया जा सकता है, सिम-इन-ए-वर्ड निर्देशों के सीमित सेट के लिए समर्थन जोड़ा गया है जो एक रजिस्टर के भीतर 8-बिट और 16-बिट डेटा पर काम करता है। ये निर्देश नवीनतम पीटीएक्स विनिर्देशों के पेज 178-182 पर विस्तृत हैं: http://docs.nvidia.com/cuda/pdf/ptx_isa_3.1.pdf इन सिमड निर्देशों का उपयोग गणना क्षमता 3.x के साथ GPUs की आवश्यकता है। पंजीकृत CUDA डेवलपर यहां घोषित किए गए रैपर फ़ंक्शंस के साथ एक हेडर फ़ाइल डाउनलोड कर सकते हैं (जो sm_1x और sm_2x GPUs के लिए इम्यूलेशन पथ भी प्रदान करता है): https://devtalk.nvidia.com/default/topic/535684/announcements/release-1- 1-of-simd-in-a-word-functions-post/ – njuffa
@njuffa: यह एक उत्तर की तरह लगता है, टिप्पणी नहीं! इसे पोस्ट करें, और हम उसकी स्वीकृति बदलने के लिए प्रवाह को राजी कर सकते हैं। –
जैसा कि a comment में उत्तर में से एक में उल्लेख किया गया था, एनवीआईडीआईए जीपीयू के कुछ सिम निर्देश हैं। वे प्रति-बाइट और प्रति-आधा शब्द आधार पर unsigned int
पर काम करते हैं। जुलाई 2015 के रूप में, निम्न कार्रवाई की several flavours हैं:
- निरपेक्ष मूल्य
- अलावा/घटाव
- कंप्यूटिंग औसत मूल्य
- तुलना
- अधिकतम/न्यूनतम
- निषेध
- पूर्ण अंतर का योग
- 1. सिम निर्देशों का उपयोग कर 3x3 मैट्रिक्स उलटा संभव है?
- 2. क्या सिम कार्ड क्रिप्टोग्राफिक फ़ंक्शंस का उपयोग करना संभव है?
- 3. एंड्रॉइड: एसडीके का उपयोग कर सिम में संपर्क कैसे जोड़ें?
- 4. क्या मुझे सिम या वेक्टर एक्सटेंशन या कुछ और उपयोग करना चाहिए?
- 5. थ्रेडस्टैटिक विशेषता के साथ समानांतर एक्सटेंशन का उपयोग करना। क्या यह स्मृति रिसाव कर सकता है?
- 6. क्या जावा 7 ऐप्पल जावा एक्सटेंशन का उपयोग कर सकता है?
- 7. सीयूडीए
- 8. सीयूडीए
- 9. आधिकारिक आईओएस एसडीके का उपयोग कर सिम परिवर्तन का पता लगाएं या सिम के आईएमएसआई को खोजें?
- 10. क्या आप समांतर एक्सटेंशन का उपयोग कर रहे हैं?
- 11. सीयूडीए
- 12. सीयूडीए
- 13. सीयूडीए
- 14. सीयूडीए
- 15. सीयूडीए
- 16. जावा का उपयोग कर क्रोम एक्सटेंशन बनाना संभव है?
- 17. क्या यह सिम योग्य है? क्या कोई बेहतर विकल्प है?
- 18. सीयूडीए
- 19. अच्छी पोर्टेबल सिम पुस्तकालय
- 20. क्या हिपहॉप में पीईसीएल एक्सटेंशन का उपयोग करना संभव है?
- 21. सीयूडीए
- 22. xs का उपयोग कर तत्वों का क्रम अनदेखा करें: एक्सटेंशन
- 23. क्या मैं एएसपीएक्स पेज में एक्सटेंशन विधियों इनलाइन का उपयोग कर सकता हूं?
- 24. क्या मैं इंटरफ़ेस को लागू करने के लिए एक्सटेंशन विधियों का उपयोग कर सकता हूं?
- 25. क्या मैं .NET 2.0 या 3.0 में एक्सटेंशन विधियों और LINQ का उपयोग कर सकता हूं?
- 26. सीयूडीए मॉडल - वार आकार क्या है?
- 27. सिम बनाम वेक्टर आर्किटेक्चर
- 28. सीयूडीए सीखने का सबसे अच्छा तरीका क्या है?
- 29. मेरी सीयूडीए बनावट मेमोरी का आकार क्या है?
- 30. क्या वैलग्रींड एकाधिक प्रोसेसर का उपयोग कर सकता है?
एसएसई सीपीयू की एक विशेषता है, जीपीयू नहीं। मुझे लगता है कि आपका मतलब है कि अगर सीयूडीए ड्राइवर हैं जो वीडियो कार्ड (जीपीयू) की बजाय सीपीयू पर एसएसई निर्देशों का उपयोग करते हैं? –
संख्या। मैं बहुत अच्छी तरह से GPU हार्डवेयर नहीं जानता। मैं बस सोच रहा था कि क्या GPU – flow