simd

6गर्मी

3उत्तर

128-बिट रजिस्टर में पैक किए गए मनमानी 16-बिट तत्वों तक पहुंच

इंटेल कंपाइलर इंट्रिनिक्स के साथ, 128-बिट रजिस्टर दिए गए, 8 16-बिट तत्वों को पैक करते हुए, मैं पंजीकरण के भीतर से (सस्ते) मनमानी तत्वों को कैसे एक्सेस करूं? _mm_cvtepi8_epi64 के बाद के उपयोग (हस्ताक्ष

10गर्मी

2उत्तर

कार्य समूहों की संख्या से संबंधित गणना इकाइयों की संख्या

मुझे कुछ स्पष्टीकरण की आवश्यकता है। मैं अपने लैपटॉप पर ओपनसीएल विकसित कर रहा हूं जो एक छोटा एनवीडिया जीपीयू (310 एम) चला रहा है। जब मैं CL_DEVICE_MAX_COMPUTE_UNITS के लिए डिवाइस से पूछता हूं, तो परिणा

6गर्मी

1उत्तर

सिम (AVX) तुलना

gcc का नाम __m256 और __m256i (AVX निर्देश सेट) की तुलना करने के लिए आंतरिक क्या है?

12गर्मी

1उत्तर

पुश एक्सएमएम स्टैक

पर एक्सएमएम रजिस्टर से पैक किए गए डबलवर्ड पूर्णांक को धक्का देने का कोई तरीका है? और फिर बाद में जरूरत पड़ने पर इसे वापस पॉप पर? आदर्श रूप में मैं PUSH या सामान्य प्रयोजन रजिस्टरों के लिए पॉप की तरह क

6गर्मी

1उत्तर

सिमड सरणी मनमानी सरणी लंबाई

के लिए जोड़ें I vector intrinsics का उपयोग करके मेरी व्यक्तिगत छवि प्रसंस्करण लाइब्रेरी को फिर से लिखकर सिम क्षमताओं का उपयोग करना सीख रहा हूं। एक बुनियादी कार्य एक सरल "सरणी +=," यानी void arrayAdd(u

10गर्मी

2उत्तर

सभी शून्यों के लिए एक्सएमएम रजिस्टर की जांच करें

क्या यह जांचने का कोई तरीका है कि __m128i चर में सभी बिट्स/बाइट्स/शब्द इत्यादि 0 हैं? मेरे ऐप में मुझे यह जांचना है कि __m128i चर में पैक किए गए सभी पूर्णांक शून्य हैं। क्या मुझे उन्हें निकालना होगा औ

9गर्मी

3उत्तर

बिना किसी असेंबली

के बिना जीसीसी के साथ एसएसई निर्देशों का उपयोग करना मुझे जीसीसी के साथ x86-64 के एसएसई वेक्टर निर्देशों का उपयोग करने में दिलचस्पी है और इसके लिए किसी भी इनलाइन असेंबली का उपयोग नहीं करना चाहते हैं। क

20गर्मी

3उत्तर

इंटेल एवीएक्स: डबल परिशुद्धता फ्लोटिंग पॉइंट चर के लिए डॉट उत्पाद का 256-बिट संस्करण

इंटेल एडवांस्ड वेक्टर एक्सटेंशन (एवीएक्स) डबल परिशुद्धता फ्लोटिंग पॉइंट चर के लिए 256-बिट संस्करण (वाईएमएम रजिस्टर) में डॉट उत्पाद प्रदान करता है। "क्यों?" प्रश्न का एक और मंच (here) और स्टैक ओवरफ्ल

16गर्मी

2उत्तर

एसएसई गुणा 4 32-बिट पूर्णांक

चार 32-बिट पूर्णांक को 4 अन्य पूर्णांक से गुणा कैसे करें? मुझे कोई निर्देश नहीं मिला जो इसे कर सकता है।

14गर्मी

3उत्तर

__builtin_clz

का कार्यान्वयन जीसीसी (4.6+) __builtin_clz का कार्यान्वयन क्या है? क्या यह इंटेल x86_64 (AVX) पर कुछ सीपीयू निर्देशों के अनुरूप है?