के घटक जोड़ना मैं एक एकल फ्लोट प्राप्त करने के लिए एसएसई रजिस्टर के चार घटक जोड़ना चाहता हूं। इस तरह मैं इसे अब करता हूं:एसएसई रजिस्टर
float a[4];
_mm_storeu_ps(a, foo128);
float x = a[0] + a[1] + a[2] + a[3];
क्या कोई एसएसई निर्देश है जो सीधे इसे प्राप्त करता है?
मुझे संदेह है कि यह अस्तित्व में है, लेकिन यदि ऐसा होता है, तो निर्देश 128-बिट आउटपुट रजिस्टर के 32-बिट क्षेत्र में परिणाम देगा, न कि 32-बिट रजिस्टर में। –