opencl

6गर्मी

1उत्तर

ओपनसीएल कर्नेल को बिटस्ट्रीम में कैसे संकलित करें?

ओपनसीएल कर्नेल को बिटस्ट्रीम में कैसे संकलित करें जिसे मैं बाद में बिना किसी संकलन के सीधे लोड कर सकता हूं? मेरा प्लेटफार्म एएमयू और एएमडी दोनों अलग GPU के साथ एएमडी मशीन है। मशीन नवीनतम एएमडी एपीपी ए

8गर्मी

1उत्तर

कार्य समूह आकार

किसी दिए गए कर्नेल के लिए, हमेशा एक ही आकार के work_groups क्यों हैं? मैंने कहीं पढ़ा है (जैसा भी मामला है जिसमें हम स्थानीय काम आकार निर्दिष्ट नहीं करते के लिए) है कि OpenCL 651 काम के आइटम (3 से विभ

10गर्मी

3उत्तर

ओपनसीएल डिवाइस विशिष्टता

क्या ओपनसीएल को उन सभी अद्वितीय भौतिक उपकरणों की सूची देने का कोई तरीका है जिनके पास ओपनसीएल कार्यान्वयन उपलब्ध है? मुझे पता है कि मंच/डिवाइस सूची के माध्यम से पुन: प्रयास कैसे करें, उदाहरण के लिए, मे

54गर्मी

1उत्तर

Abysmal OpenCL ImageSampling प्रदर्शन बनाम OpenGL TextureSampling

मैंने हाल ही में ओपनजीएल से ओपनसीएल तक अपना वॉल्यूमेराकास्टर पोर्ट किया है, जिसने रेकास्टर के प्रदर्शन को लगभग 9 0 प्रतिशत घटा दिया है। मैंने ओपनसीएल के इमेजम्प्लिंग कार्यों में प्रदर्शन में कमी को ट्

16गर्मी

3उत्तर

सीपीयू के रूप में जीपीयू का उपयोग क्यों नहीं करते?

मुझे पता है कि सवाल केवल आंशिक रूप से प्रोग्रामिंग से संबंधित है क्योंकि उत्तर मैं मूल रूप से इन दो प्रश्नों से प्राप्त करना चाहता हूं: सीपीयू कोर संख्या इतनी कम क्यों है (बनाम GPU)? और हम CPUs के बजा

7गर्मी

5उत्तर

छवियों का आकार बदलना (जेपीईजी या डिकंप्रेस्ड छवि)

मेरे आखिरी प्रश्न में मैंने पूछा कि क्या rotate images के बारे में मैंने सोचा था कि बेहतर तरीका था या नहीं। मैं jpegtran की खोज समाप्त हो गया और तब से libjpeg-turbo पाया है। अब मैं छविमैजिक और ग्राफिक

7गर्मी

1उत्तर

ओपनसीएल

में फ़ंक्शन पैरामीटर में सरणी पास करना ओपनसीएल में फ़ंक्शन में सरणी कैसे पास करूं? मैं त्रुटि _global नाव * "के प्रकार ..argument" मिल गया ग [n] = FindIndexFromArray (एक, 3) लाइन में नाव * "" प्रकार क

5गर्मी

1उत्तर

ओपनएसीसी का उपयोग कर मैट्रिक्स गुणा को अनुकूलित करने के लिए कैसे?

मैं ओपनएसीसी (पीजीआई के कंपाइलर के साथ) सीख रहा हूं और मैट्रिक्स गुणा उदाहरण को अनुकूलित करने की कोशिश कर रहा हूं। void matrix_mul(float *restrict r, float *a, float *b, int N, int accelerate){ #pra

7गर्मी

4उत्तर

GPU CPU या CPU से पढ़ता है GPU को लिखता है?

मैं समांतर प्रोग्रामिंग में शुरुआत कर रहा हूं। मेरे पास एक प्रश्न है जो मूर्खतापूर्ण प्रतीत हो सकता है लेकिन जब मैंने इसे बाहर निकाला तो मुझे एक निश्चित जवाब नहीं मिला। जीपीयू कंप्यूटिंग में एक डिवाइस

6गर्मी

3उत्तर

सीयूडीए/ओपनसीएल; गैर शाखाओं में अभिव्यक्ति के रूप में फिर से लिखने शाखाओं

समय एक शाखा एक CUDA या OpenCL कार्यक्रम में आवश्यक है, की तरह के अधिकांश: for (int i=0; i<width; i++) { if(i % threadIdx.x == 0) quantity += i*i; } कोड हमेशा (या कम से कम, ज्यादातर समय)