पुस्तक में Programming Massively Parallel Processors
विभिन्न मैट्रिक्स गुणात्मक कर्नेल की दक्षता की तुलना करने के लिए gflops की संख्या का उपयोग किया जाता है। मैं अपनी मशीन पर अपने स्वयं के कर्नल के लिए इसकी गणना कैसे करूं?मैट्रिक्स गुणा कर्नेल के gflops को मापने के लिए कैसे?
कहीं भी एनवीआईडीआईए मंचों में मुझे यह 'एल्गोरिदम' मिला, लेकिन मुझे नहीं पता, यह कितना मान्य है या कहां से दो बार आता है।
NumOps = 2 * pow(MatrixSize,3)
gflops = 1.0e-9 * NumOps/ExecutionTime
पेज। कृपया टैग को बदलने में संकोच न करें ...
+1। मुझे बस उस बिल्टिन एफएमएडी (फ़्यूज्ड गुणा और एड) निर्देश के साथ हार्डवेयर पर जोड़ने दें, जिसमें सभी नवीनतम एनवीडिया जीपस शामिल हैं, लोग मैट्रिक्स साइज़^3 टर्म के सामने 2 के कारक का उपयोग करना चाहते हैं या नहीं। जब तक आप इसे लगातार करते हैं, तब तक इससे कोई फर्क नहीं पड़ता। –