मैंने स्वयं को CUDA कर्नेल प्रोग्राम किया। सीपीयू कोड की तुलना करें, मेरा कर्नेल कोड CPUs से 10 गुना तेज है।सीयूडीए प्रदर्शन का मूल्यांकन कैसे करें?
लेकिन मेरे प्रयोगों से मुझे सवाल है।
क्या मेरा प्रोग्राम पूरी तरह से सभी जीपीयू कोर, उचित साझा मेमोरी उपयोग, पर्याप्त पंजीकरण गिनती, पर्याप्त अधिभोग का उपयोग करके अनुकूलित किया गया है?
मैं अपने कर्नेल कोड के प्रदर्शन का मूल्यांकन कैसे कर सकता हूं?
मैं सैद्धांतिक रूप से CUDA के अधिकतम थ्रूपुट को कैलकुलेटर कैसे कर सकता हूं?
क्या मैं सही हूं कि सीपीयू के जीएफएलपीएस और जीपीयू के जीएफएलपीएस और जीएफएलओपीएस दर के बीच की तुलना उनके पारदर्शी सैद्धांतिक प्रदर्शन है?
अग्रिम धन्यवाद।
धन्यवाद, रोजर। आपकी टिप्पणी मेरे लिए अच्छा है। –
मेरे पास अतिरिक्त प्रश्न है। मान लीजिए सीपीयू: 2.8GHz, 1 कोर GPU: 1.6GHz, 384 कोर (GTX 560 ती युक्ति) इस उदाहरण में, CPU के अपेक्षित प्रदर्शन 2.8GHz एक्स 1 कोर = 2.8GHz · कोर GPU की उम्मीद प्रदर्शन है 0.8GHz x 384 कोर = 307.2 गीगा · कोर यह गणना मान्य है? –
आप जीएचजेड में प्रदर्शन को माप नहीं सकते हैं। सैद्धांतिक प्रदर्शन खोजने के लिए, आपको यह पता लगाना होगा कि प्रत्येक घड़ी चक्र में सीपीयू/जीपीयू क्या कर सकता है। और मैंने जो विचारों का उल्लेख किया है, वे आपके द्वारा प्राप्त किए जा सकने वाले प्रदर्शन को प्रभावित करते हैं। उदाहरण के लिए, यदि आप इंटेल सैंडी ब्रिज के प्रदर्शन को देख रहे हैं, तो आपको यह ध्यान रखना होगा कि इसमें एवीएक्स नामक एक निर्देश सेट है जो प्रति निर्देश 8 एसपी ऑपरेशंस कर सकता है। –