simd

    5गर्मी

    2उत्तर

    मुझे लगता है, मैंने इसके बारे में सुना है, लेकिन यह नहीं पता कि कहां है। upd: मैं जीत

    9गर्मी

    3उत्तर

    मान लीजिए मैं दो बफ़र्स जोड़ सकते हैं और परिणाम संग्रहीत करना चाहते हैं। दोनों बफर पहले से ही 16byte गठबंधन आवंटित कर रहे हैं। मुझे दो उदाहरण मिलते हैं कि यह कैसे करें। पहले एक _mm_load उपयोग कर रहा ह

    5गर्मी

    1उत्तर

    मैं एसएसई इंट्रिनिक्स के लिए एक जोड़े रैपर कक्षाएं लिख रहा हूं - ज्यादातर प्रकार-सुरक्षित ज्यामिति संचालन प्राप्त करने के लिए, लेकिन कुछ सुविधा कार्यों को जोड़ने के लिए भी। मेरे सभी कार्य और ऑपरेटर इन

    16गर्मी

    3उत्तर

    मैं दो __m128 मानों को एक __m256 पर जोड़ना चाहता हूं। कुछ इस तरह: __m256 c = { 1, 2, 3, 4, 5, 6, 7, 8 }; किसी भी intrinsics है कि मैं यह करने के लिए उपयोग कर सकते हैं देखते हैं: __m128 a = _mm_set_p

    16गर्मी

    4उत्तर

    पर सिम प्रीफिक्स योग मुझे एक उपसर्ग योग एल्गोरिदम लागू करने की आवश्यकता है और इसे यथासंभव तेज़ी से आवश्यकता होगी। पूर्व: [3, 1, 7, 0, 4, 1, 6, 3] should give [3, 4, 11, 11, 15, 16, 22, 25] इस का उ

    10गर्मी

    1उत्तर

    का उपयोग कर लुक-अप टेबल मेरे पास एक बड़ा पिक्सेल प्रोसेसिंग फ़ंक्शन है जिसे मैं वर्तमान में आंतरिक कार्यों का उपयोग करके अनुकूलित करने का प्रयास कर रहा हूं। एसएसई नौसिखिया होने के नाते, मुझे यकीन नहीं

    6गर्मी

    1उत्तर

    मैं एसएसई 2 निर्देशों के लिए नया हूं। मुझे एक निर्देश _mm_add_epi8 मिला है जो दो सरणी तत्व जोड़ सकता है। लेकिन मुझे एक एसएसई निर्देश चाहिए जो एक सरणी के सभी तत्व जोड़ सकता है। #include <iostream> #in

    11गर्मी

    2उत्तर

    पर एसएसई 2 का उपयोग करके ओवरफ़्लो के बिना हस्ताक्षरित बाइट्स की कुल कमी, मैं इंटेल i3 प्रोसेसर पर 32 तत्वों (प्रत्येक 1 बाइट डेटा) की कुल कमी को खोजने का प्रयास कर रहा हूं। मैंने यह किया: s=0; for (i

    5गर्मी

    1उत्तर

    मैं सी में निम्नलिखित कोड को कैसे सिमडाइज़ कर सकता हूं (पाठ्यक्रम के सिमड इंट्रिनिक्स का उपयोग करके)? मैं SIMD intrinsics समझने में कोई परेशानी हो रहा है और यह एक बहुत मदद मिलेगी: int sum_naive(int n,

    14गर्मी

    3उत्तर

    मैं वर्तमान में c++ (c++11 के साथ) में एक ओपन सोर्स 3 डी एप्लिकेशन फ्रेमवर्क विकसित कर रहा हूं। मेरी अपनी गणित पुस्तकालय XNA math library की तरह डिज़ाइन की गई है, साथ ही SIMD दिमाग में भी है। लेकिन वर