2011-03-08 16 views
10

मैं थोड़ा सा Google हूं, लेकिन यह अब मुझे स्पष्ट नहीं है कि क्या सीयूडीए के साथ प्रोग्राम किए गए कुछ जीपीयू लाभ ले सकते हैं या एसएसई सिम एक्सटेंशन से संबंधित निर्देशों का उपयोग कर सकते हैं; उदाहरण के लिए कि क्या हम डबल परिशुद्धता में फ्लोट के दो वैक्टरों को जोड़ सकते हैं, प्रत्येक में 4 मान हैं। यदि ऐसा है, तो मुझे आश्चर्य है कि वेक्टर के पिछले 4 मानों में से प्रत्येक के लिए अधिक हल्का धागे का उपयोग करना बेहतर होगा या सिमड का उपयोग करना बेहतर होगा।क्या सीयूडीए सिम एक्सटेंशन का उपयोग कर सकता है?

+0

एसएसई सीपीयू की एक विशेषता है, जीपीयू नहीं। मुझे लगता है कि आपका मतलब है कि अगर सीयूडीए ड्राइवर हैं जो वीडियो कार्ड (जीपीयू) की बजाय सीपीयू पर एसएसई निर्देशों का उपयोग करते हैं? –

+0

संख्या। मैं बहुत अच्छी तरह से GPU हार्डवेयर नहीं जानता। मैं बस सोच रहा था कि क्या GPU – flow

उत्तर

16

CUDA प्रोग्राम PTX instruction set पर संकलित करते हैं। उस निर्देश सेट में सिम निर्देश नहीं हैं। इसलिए, सीयूडीए कार्यक्रम सिम के स्पष्ट उपयोग नहीं कर सकते हैं।

हालांकि, सीयूडीए का पूरा विचार एक बड़े पैमाने पर सिम करना है। व्यक्तिगत धागे वार्प्स नामक समूहों का हिस्सा होते हैं, जिसके भीतर प्रत्येक थ्रेड निर्देशों के बिल्कुल समान अनुक्रम निष्पादित करता है (हालांकि कुछ निर्देशों को कुछ थ्रेड के लिए दबाया जा सकता है, जिससे विभिन्न निष्पादन अनुक्रमों का भ्रम हो सकता है)। एनवीडिया इसे एकल निर्देश, एकाधिक थ्रेड (सिम) कहते हैं, लेकिन यह अनिवार्य रूप से सिम है।

+9

PTX 3.0 पर CUDA थ्रेड पर सिम निर्देशों का उपयोग किया जा सकता है, सिम-इन-ए-वर्ड निर्देशों के सीमित सेट के लिए समर्थन जोड़ा गया है जो एक रजिस्टर के भीतर 8-बिट और 16-बिट डेटा पर काम करता है। ये निर्देश नवीनतम पीटीएक्स विनिर्देशों के पेज 178-182 पर विस्तृत हैं: http://docs.nvidia.com/cuda/pdf/ptx_isa_3.1.pdf इन सिमड निर्देशों का उपयोग गणना क्षमता 3.x के साथ GPUs की आवश्यकता है। पंजीकृत CUDA डेवलपर यहां घोषित किए गए रैपर फ़ंक्शंस के साथ एक हेडर फ़ाइल डाउनलोड कर सकते हैं (जो sm_1x और sm_2x GPUs के लिए इम्यूलेशन पथ भी प्रदान करता है): https://devtalk.nvidia.com/default/topic/535684/announcements/release-1- 1-of-simd-in-a-word-functions-post/ – njuffa

+2

@njuffa: यह एक उत्तर की तरह लगता है, टिप्पणी नहीं! इसे पोस्ट करें, और हम उसकी स्वीकृति बदलने के लिए प्रवाह को राजी कर सकते हैं। –

5

जैसा कि a comment में उत्तर में से एक में उल्लेख किया गया था, एनवीआईडीआईए जीपीयू के कुछ सिम निर्देश हैं। वे प्रति-बाइट और प्रति-आधा शब्द आधार पर unsigned int पर काम करते हैं। जुलाई 2015 के रूप में, निम्न कार्रवाई की several flavours हैं:

  • निरपेक्ष मूल्य
  • अलावा/घटाव
  • कंप्यूटिंग औसत मूल्य
  • तुलना
  • अधिकतम/न्यूनतम
  • निषेध
  • पूर्ण अंतर का योग
संबंधित मुद्दे