simd

    5गर्मी

    2उत्तर

    यह कुछ मूल जानकारी के साथ इस मूल प्रश्न का अनुवर्ती प्रकार है। यदि आप रुचि रखते हैं तो पहले भाग के लिए यहां देखें: Struct of arrays, arrays of structs and memory usage pattern ऐसा लगता है कि एक साधारण

    6गर्मी

    2उत्तर

    मैं एक जटिल संख्यात्मक एल्गोरिदम के कार्यान्वयन को स्विच करने के लिए प्रोसेसर सुविधाओं के आधार पर सीपीयू प्रेषण का उपयोग करने की प्रक्रिया में हूं। मैं दो संस्करणों (तर्क के लिए एक एसएसई 2 और एसएसई 3

    7गर्मी

    1उत्तर

    के लिए बहु-आयामी सरणी का संरेखण यदि मैं omp simd निर्माण के खंड को समझता हूं, तो यह पूरे सरणी के संरेखण को संदर्भित करता है। बहु-आयामी सरणी के लिए इसका उपयोग कैसे किया जाता है? मान लें ni = 131; nj =

    13गर्मी

    2उत्तर

    मैं सिम (एकल निर्देश एकाधिक डेटा) के साथ प्रयोग करना चाहता हूं। Google समूह पोस्टिंग से मैं जो भी प्राप्त कर सकता हूं, उससे लोग Google क्रोम में इसे जोड़ने के लिए काम कर रहे हैं, लेकिन जब मैं क्रोम 46

    5गर्मी

    2उत्तर

    का उपयोग कर फास्ट डॉट उत्पाद मैं 3 या 4 घटकों वाले वैक्टर के डॉट उत्पाद की गणना करने के लिए एक तेज़ तरीका ढूंढ रहा हूं। मैंने कई चीजों की कोशिश की, लेकिन अधिकांश उदाहरण ऑनलाइन फ्लोट की एक सरणी का उपयो

    8गर्मी

    2उत्तर

    https://hackage.haskell.org/package/ghc-prim-0.4.0.0/docs/GHC-Prim.html#g:28 का उपयोग कर हास्केल में सिम-आधारित वेक्टर लाइब्रेरी लिखना संभव है लेकिन क्या इसका कोई अर्थ होगा? मैं हास्केल में स्वचालित स

    6गर्मी

    2उत्तर

    के शफल तत्व I__m256i वेक्टर के तत्वों को घुमाने के लिए चाहते हैं। और एक आंतरिक _mm256_shuffle_epi8 है जो कुछ ऐसा करता है, लेकिन यह क्रॉस लेन शफल नहीं करता है। मैं AVX2 निर्देशों का उपयोग करके इसे कैसे

    9गर्मी

    1उत्तर

    में सिम के लिए वेक्टर का उपयोग करके मैं एक एल्गोरिदम को सदिश बनाने और सीपीयू के सिमड ऑपरेशंस का लाभ लेने के लिए System.Numerics.Vector (T) का उपयोग करने का प्रयास कर रहा हूं। हालांकि, मेरे मूल कार्यान

    9गर्मी

    2उत्तर

    के माध्यम से समानांतर मैट्रिक्स गुणात्मकता मैं मल्टीकोर आर्किटेक्चर पर मैट्रिक्स गुणा को गति देने की कोशिश कर रहा हूं। इस अंत में, मैं एक ही समय में धागे और सिम का उपयोग करने की कोशिश करता हूं। लेकिन

    5गर्मी

    1उत्तर

    मैं एक छवि में एक एकल आरजीबी पिक्सेल स्टोर करने के लिए एक संरचना बना रहा हूं। struct Pixel { // color values range from 0.0 to 1.0 float r, g, b; }__attribute__((aligned(16)); मैं 128 बि