2012-06-01 15 views
5

मैं चारों ओर घूम रहा हूं और from here से जुड़े टेक टेक में से एक में कम्प्यूट क्षमता 3.0 में नई गतिशील समांतरता के a trivial example को खोजने में सक्षम हूं। मुझे पता है कि एचपीसी-विशिष्ट कार्ड probably won't be available अगले वर्ष इस समय तक (नाट्ल लैब्स के बाद उन्हें प्राप्त होगा)। और हां, मुझे एहसास है कि उन्होंने जो सरल उदाहरण दिया है वह आपको जाने के लिए पर्याप्त है, लेकिन अधिक मेरियर है।सीयूडीए 5 गतिशील समांतरता उदाहरणों की कमी

क्या ऐसे अन्य उदाहरण हैं जिन्हें मैंने याद किया है?

आप मुसीबत बचाने के लिए, यहाँ तकनीक संक्षिप्त में दिए गए पूरे उदाहरण है:

__global__ ChildKernel(void* data){ 
    //Operate on data 
} 
__global__ ParentKernel(void *data){ 
    ChildKernel<<<16, 1>>>(data); 
} 
// In Host Code 
ParentKernel<<<256, 64>>(data); 

// Recursion is also supported 
__global__ RecursiveKernel(void* data){ 
    if(continueRecursion == true) 
     RecursiveKernel<<<64, 16>>>(data); 
} 

संपादित करें: जीटीसी बात New Features In the CUDA Programming Model CUDA 5 में नए डायनामिक समानता पर ज्यादातर ध्यान केंद्रित लिंक है वीडियो और स्लाइड। अभी भी खिलौने के उदाहरण, लेकिन उपरोक्त तकनीक संक्षेप से बहुत अधिक विस्तार।

+2

आपकी प्रश्न वास्तव में क्या है? शायद मैं यहाँ कुछ याद कर रहा हूँ। आप हमें क्या जवाब देना चाहते हैं? – Bart

+1

"क्या कोई अन्य उदाहरण हैं जिन्हें मैंने याद किया है?" एक उचित सवाल नहीं है? यदि आपको नहीं लगता कि यह मेरे प्रश्न के लिए उपयुक्त मंच है तो बस इसे घटाएं। – maxywb

+0

जीटीसी में, केपलर के लिए दिखाए गए डेमो में से एक आकाशगंगाओं का टकराव था। मुझे लगता है कि वे गतिशील समांतरता का उपयोग कर रहे थे। शायद इसके लिए कोड कहीं भी उपलब्ध है। –

उत्तर

0

मुझे लगता है कि गणना क्षमता 3.0 में गतिशील पक्षाघात शामिल नहीं है। इसे जीके 110 आर्किटेक्चर (उर्फ "बिग केप्लर") में शामिल किया जाएगा, मुझे नहीं पता कि गणना क्षमता संख्या कितनी असाइन की जाएगी (3.1? शायद)। वे कार्ड इस साल के अंत तक उपलब्ध नहीं होंगे (मैं उन लोगों के लिए बहुत इंतजार कर रहा हूं)। जहां तक ​​मुझे पता है कि 3.0 जीटीएक्स 4 9 0 जी जीटी 640 एम लैपटॉप के लिए जीके 104 चिप्स से मेल खाता है।

+1

के साथ समर्थित है क्योंकि कोई 3.1 गणना क्षमता नहीं है! 3.5 जीके 110 की वास्तविक क्षमता है। – geek

4

मैंने प्रश्न शीर्षक को "... CUDA 5 ..." में संपादित किया है, क्योंकि गतिशील समांतरता CUDA 5 में नई है, CUDA नहीं 4. हमारे पास अभी तक कोई सार्वजनिक उदाहरण उपलब्ध नहीं है, क्योंकि हम नहीं करते हैं सार्वजनिक हार्डवेयर उपलब्ध है जो उन्हें चला सकता है। सीयूडीए 5.0 गतिशील समांतरता का समर्थन करेगा, लेकिन केवल गणना क्षमता 3.5 और बाद में (उदाहरण के लिए जीके 110)। ये बाद में वर्ष में उपलब्ध होंगे।

हम हार्डवेयर के उपलब्ध होने के करीब एक CUDA 5 रिलीज उम्मीदवार के साथ कुछ उदाहरण जारी करेंगे।

+0

क्या हमें लगता है कि पैरेंट कर्नेल कॉल के अंदर नया कर्नेल कॉल बिल्कुल नया कर्नेल कॉल (जैसा होस्ट से कहा जाता है) के रूप में कॉल करता है? अर्थात्, हमारे पास साझा स्मृति से संबंधित कुछ मुद्दे हैं, विचलन को रोकना आदि। इसके बारे में कुछ और पढ़ना दिलचस्प होगा, विशेष रूप से कौन सा थ्रेड किसी अन्य कर्नेल को कॉल कर सकता है, इसकी लागत आदि। – phoad

0

बस हाल ही में जारी किए गए CUDA 5 आरसी को जारी किए गए सभी के साथ जांच करना चाहता था। मैंने एसडीके उदाहरणों में देखा और वहां कोई गतिशील समांतरता नहीं ढूंढ पाई। अगर मैं गलत हूं तो कोई मुझे सही करेगा। मैंने "< < <" के लिए grepping द्वारा कर्नेल के भीतर कर्नेल लॉन्च की खोज की "और कुछ भी नहीं मिला।

+0

मैं अभी भी तकनीक संक्षिप्त खोजने में सक्षम हूं। रिलीज शेड्यूल की मेरी समझ से, नाट लैब्स को बिग केप्लर कार्ड पर पहली बार क्रैक मिलेगा और बाकी हम उन्हें अगले साल जल्दी ही प्राप्त करेंगे। हालांकि यह अभी भी उदाहरणों की कमी की व्याख्या नहीं करता है। – maxywb

5

बस यह पुष्टि करने के लिए कि गतिशील समांतरता केवल 3.5 ऊपर की गणना क्षमता के साथ GPU पर समर्थित है। त्रुटि:

मैं CUDA 5.0 के साथ एक 3.0 GPU स्थापित मैं गतिशील समानता उदाहरण NVCC -arch = sm_30 test.cu

संकलित और नीचे संकलन त्रुटि test.cu (10) प्राप्त हुआ है है बुला वैश्विक फ़ंक्शन ("child_launch") वैश्विक फ़ंक्शन ("parent_launch") केवल compute_35 आर्किटेक्चर या ऊपर की अनुमति है।

GPU जानकारी

डिवाइस 0: "GeForce जी.टी. 640" CUDA ड्राइवर संस्करण/रनटाइम संस्करण 5.0/5.0 CUDA क्षमता मेजर/माइनर संस्करण संख्या: 3।0

उम्मीद है कि यह

संबंधित मुद्दे