2012-09-10 13 views
8

साझा मेमोरी एक्सेस करते समय केर्प्लर 2x या 4x फर्मि की बैंडविड्थ है?साझा मेमोरी बैंडविड्थ फर्मि बनाम केप्लर जीपीयू

प्रोग्रामिंग गाइड राज्यों: (2.X के लिए) "प्रत्येक बैंक के अनुसार दो घड़ी चक्र 32 बिट के एक बैंडविड्थ है", और "प्रत्येक बैंक के अनुसार घड़ी चक्र 64 बिट्स के एक बैंडविड्थ है" (3। एक्स), तो 4x निहित है?

+0

@ टॉम: मैं 5.0 पीजी से उद्धरण दे रहा हूं। (वास्तव में 3.X बैंडविड्थ के बारे में वाक्य w.r.t 4.2 पीजी जोड़ा गया है।)। दोनों मामलों में 32 बैंक हैं। मेरा प्रश्न [इस प्रेजेंटेशन] के पी 81 के कारण है (http://developer.download.nvidia.com/GTC/PDF/GTC2012/PresentationPDF/S0514-GTC2012-GPU-Performance-Analysis.pdf) जहां वे बैंडविड्थ कहते हैं एक्स 2 है मुझे 2.X और 3.X पर विभिन्न घड़ियों के लिए कोई संदर्भ नहीं दिखाई देता है, और मुझे विश्वास है कि "घड़ी चक्र" का उपयोग कब किया जाता है, इसका मतलब सभी गणना क्षमताओं पर समान है (जैसे, निर्देश थ्रूपुट के साथ भी)। एचजे में ये घड़ी चक्र क्या हैं इस quesiton के लिए प्रासंगिक नहीं है। –

+0

घड़ी की आवृत्ति मौलिक है क्योंकि आप बैंडविड्थ के बारे में बात कर रहे हैं जिन्हें आम तौर पर बाइट्स/सेकंड में मापा जाता है, बाइट्स/चक्र से बाइट्स/सेकंड तक जाने के लिए घड़ी आवृत्ति की आवश्यकता होती है। मैं सहमत हूं कि डॉक्टर अस्पष्ट है, और उम्मीद है कि सीयूडीए 5.0 अंतिम रिलीज में सुधार होगा (आपके पास संस्करण रिलीज उम्मीदवार से संभवतः है)। – Tom

उत्तर

6

फर्मि पर, प्रत्येक एसएम में 32 बैंक प्रत्येक दो चक्र चक्रों पर 32 बिट वितरित करते हैं।

केप्लर पर, प्रत्येक एसएमएक्स में 32 बैंक हर घड़ी चक्र पर 64 बिट्स वितरित करते हैं। हालांकि केप्लर के एसएमएक्स को मूल रूप से ऊर्जा कुशल होने के लिए फिर से डिजाइन किया गया था, और तेजी से घड़ियों को चलाने से बहुत सारी शक्तियां मिलती हैं, केप्लर बहुत धीमी कोर घड़ी से संचालित होता है। अधिक जानकारी के लिए, लगभग 8 मिनट में जीटीसी से Inside Kepler बात देखें।

तो सवाल का जवाब यह है कि केप्लर में ~ 2x, 4x नहीं है।

दस्तावेजों का अगला संस्करण (सीयूडीए 5.0) इसे बेहतर समझा जाना चाहिए।

+0

मैं आपका बिंदु देखना शुरू कर रहा हूं। 3.X पर एसपी प्राथमिक जीपीयू घड़ी पर चलते हैं, जबकि 2.X पर वे शेडर घड़ी पर चलते हैं, जो 2x प्राथमिक जीपीयू घड़ी थी। तो केप्लर पर यह "प्रति प्राथमिक घड़ी चक्र" है, और फर्मि पर यह "प्रति दो शेडर घड़ी चक्र" (= प्रति प्राथमिक घड़ी चक्र) था। इसलिए प्राथमिक जीपीयू घड़ी परिप्रेक्ष्य से एक्सेस अक्सर समान होता है, और 2x बैंडविड्थ व्यापक 64-बिट शब्दों से आता है। यह केप्लर व्हाइटपेपर के "एसएमएक्स प्रोसेसिंग कोर आर्किटेक्चर" में भी दिखाई देता है। एसपी की घड़ी की दर के बारे में कुछ सीखना अच्छा है! धन्यवाद! –

1

प्रोग्रामिंग मार्गदर्शिका 4.2 में दिए गए के रूप में: साझा मेमोरी 16 बैंकों कि इस तरह की है कि लगातार 32-बिट शब्द लगातार बैंकों के लिए नक्शे का आयोजन किया जाता है। प्रत्येक बैंक में प्रति घड़ी चक्र 32 बिट्स की बैंडविड्थ होती है।

केप्लर व्हाइटपेपर: 64b और बड़े भार संचालन के लिए साझा मेमोरी बैंडविड्थ भी फर्मि एसएम की तुलना में दोगुनी हो जाती है, जो प्रति कोर 256 बी तक है।

छोटे लोड संचालन के लिए, यह 4 एक्स है।

+0

@ टॉम: यदि बैंकों की संख्या समान है, यदि यह केर्प्लर में 32 बी/2 सीसी और केपलर में 64 बी/1 सीसी लेती है, तो इसका गणितीय 4 एक्स है। तर्क पर अधिक स्पष्टीकरण की आवश्यकता है। – Fr34K

+2

सवाल फर्मि (2.x) और केप्लर (3.x) की तुलना करने के लिए कह रहा है। 16 बैंकों के बारे में प्रोग्रामिंग गाइड से उद्धरण वास्तव में 1.x सेक्शन में है। केप्लर बनाम फर्मि 2x है। – Tom

+0

यह मत भूलना कि केप्लर घड़ी ऊर्जा को बचाने के लिए धीमी है (वीडियो को मैंने अपने उत्तर में लिंक किया है)। – Tom

संबंधित मुद्दे