यह सवाल कई कर्नेल CUDA में कई तुल्यकालन आदेश cudaStreamSynchronize, CudaDeviceSynchronize देखते हैं चलाने के लिए CUDA धाराओं का इस्तेमाल करके से संबंधित है, cudaThreadSynchronize, और भी cudaStreamQuer
मेरे सीयूडीए विकास के लिए, मैं 16 कोर के साथ एक मशीन और 16 जीएम के साथ 1 जीटीएक्स 580 जीपीयू का उपयोग कर रहा हूं। जो काम मैं कर रहा हूं, उसके लिए मैं 16 होस्ट थ्रेड्स (प्रत्येक कोर पर 1) लॉन्च करने की