simd

    6गर्मी

    3उत्तर

    इंटेल कंपाइलर इंट्रिनिक्स के साथ, 128-बिट रजिस्टर दिए गए, 8 16-बिट तत्वों को पैक करते हुए, मैं पंजीकरण के भीतर से (सस्ते) मनमानी तत्वों को कैसे एक्सेस करूं? _mm_cvtepi8_epi64 के बाद के उपयोग (हस्ताक्ष

    10गर्मी

    2उत्तर

    मुझे कुछ स्पष्टीकरण की आवश्यकता है। मैं अपने लैपटॉप पर ओपनसीएल विकसित कर रहा हूं जो एक छोटा एनवीडिया जीपीयू (310 एम) चला रहा है। जब मैं CL_DEVICE_MAX_COMPUTE_UNITS के लिए डिवाइस से पूछता हूं, तो परिणा

    6गर्मी

    1उत्तर

    gcc का नाम __m256 और __m256i (AVX निर्देश सेट) की तुलना करने के लिए आंतरिक क्या है?

    12गर्मी

    1उत्तर

    पर एक्सएमएम रजिस्टर से पैक किए गए डबलवर्ड पूर्णांक को धक्का देने का कोई तरीका है? और फिर बाद में जरूरत पड़ने पर इसे वापस पॉप पर? आदर्श रूप में मैं PUSH या सामान्य प्रयोजन रजिस्टरों के लिए पॉप की तरह क

    6गर्मी

    1उत्तर

    के लिए जोड़ें I vector intrinsics का उपयोग करके मेरी व्यक्तिगत छवि प्रसंस्करण लाइब्रेरी को फिर से लिखकर सिम क्षमताओं का उपयोग करना सीख रहा हूं। एक बुनियादी कार्य एक सरल "सरणी +=," यानी void arrayAdd(u

    10गर्मी

    2उत्तर

    क्या यह जांचने का कोई तरीका है कि __m128i चर में सभी बिट्स/बाइट्स/शब्द इत्यादि 0 हैं? मेरे ऐप में मुझे यह जांचना है कि __m128i चर में पैक किए गए सभी पूर्णांक शून्य हैं। क्या मुझे उन्हें निकालना होगा औ

    9गर्मी

    3उत्तर

    के बिना जीसीसी के साथ एसएसई निर्देशों का उपयोग करना मुझे जीसीसी के साथ x86-64 के एसएसई वेक्टर निर्देशों का उपयोग करने में दिलचस्पी है और इसके लिए किसी भी इनलाइन असेंबली का उपयोग नहीं करना चाहते हैं। क

    20गर्मी

    3उत्तर

    इंटेल एडवांस्ड वेक्टर एक्सटेंशन (एवीएक्स) डबल परिशुद्धता फ्लोटिंग पॉइंट चर के लिए 256-बिट संस्करण (वाईएमएम रजिस्टर) में डॉट उत्पाद प्रदान करता है। "क्यों?" प्रश्न का एक और मंच (here) और स्टैक   ओवरफ्ल

    16गर्मी

    2उत्तर

    चार 32-बिट पूर्णांक को 4 अन्य पूर्णांक से गुणा कैसे करें? मुझे कोई निर्देश नहीं मिला जो इसे कर सकता है।

    14गर्मी

    3उत्तर

    का कार्यान्वयन जीसीसी (4.6+) __builtin_clz का कार्यान्वयन क्या है? क्या यह इंटेल x86_64 (AVX) पर कुछ सीपीयू निर्देशों के अनुरूप है?