वेक्टरिंग कोड के दौरान कैश की संख्या में वृद्धि हुई है, मैंने एसएसई 4.2 और एवीएक्स 2 के साथ 2 वैक्टरों के बीच डॉट उत्पाद को सदिशित किया है, जैसा कि आप नीचे देख सकते हैं। कोड को ओओसी अनुकूलन ध्वज के सा
मैंने अपने आप से पूछा कि समांतर कार्यक्रम के प्रदर्शन (फ्लॉप में) को मापने का सबसे अच्छा तरीका क्या होगा। मैंने papi_flops के बारे में पढ़ा। ऐसा लगता है कि एक धारावाहिक कार्यक्रम के लिए ठीक काम करता ह