opencl

    6गर्मी

    1उत्तर

    ओपनसीएल कर्नेल को बिटस्ट्रीम में कैसे संकलित करें जिसे मैं बाद में बिना किसी संकलन के सीधे लोड कर सकता हूं? मेरा प्लेटफार्म एएमयू और एएमडी दोनों अलग GPU के साथ एएमडी मशीन है। मशीन नवीनतम एएमडी एपीपी ए

    8गर्मी

    1उत्तर

    किसी दिए गए कर्नेल के लिए, हमेशा एक ही आकार के work_groups क्यों हैं? मैंने कहीं पढ़ा है (जैसा भी मामला है जिसमें हम स्थानीय काम आकार निर्दिष्ट नहीं करते के लिए) है कि OpenCL 651 काम के आइटम (3 से विभ

    10गर्मी

    3उत्तर

    क्या ओपनसीएल को उन सभी अद्वितीय भौतिक उपकरणों की सूची देने का कोई तरीका है जिनके पास ओपनसीएल कार्यान्वयन उपलब्ध है? मुझे पता है कि मंच/डिवाइस सूची के माध्यम से पुन: प्रयास कैसे करें, उदाहरण के लिए, मे

    54गर्मी

    1उत्तर

    मैंने हाल ही में ओपनजीएल से ओपनसीएल तक अपना वॉल्यूमेराकास्टर पोर्ट किया है, जिसने रेकास्टर के प्रदर्शन को लगभग 9 0 प्रतिशत घटा दिया है। मैंने ओपनसीएल के इमेजम्प्लिंग कार्यों में प्रदर्शन में कमी को ट्

    16गर्मी

    3उत्तर

    मुझे पता है कि सवाल केवल आंशिक रूप से प्रोग्रामिंग से संबंधित है क्योंकि उत्तर मैं मूल रूप से इन दो प्रश्नों से प्राप्त करना चाहता हूं: सीपीयू कोर संख्या इतनी कम क्यों है (बनाम GPU)? और हम CPUs के बजा

    7गर्मी

    5उत्तर

    मेरे आखिरी प्रश्न में मैंने पूछा कि क्या rotate images के बारे में मैंने सोचा था कि बेहतर तरीका था या नहीं। मैं jpegtran की खोज समाप्त हो गया और तब से libjpeg-turbo पाया है। अब मैं छविमैजिक और ग्राफिक

    7गर्मी

    1उत्तर

    में फ़ंक्शन पैरामीटर में सरणी पास करना ओपनसीएल में फ़ंक्शन में सरणी कैसे पास करूं? मैं त्रुटि _global नाव * "के प्रकार ..argument" मिल गया ग [n] = FindIndexFromArray (एक, 3) लाइन में नाव * "" प्रकार क

    5गर्मी

    1उत्तर

    मैं ओपनएसीसी (पीजीआई के कंपाइलर के साथ) सीख रहा हूं और मैट्रिक्स गुणा उदाहरण को अनुकूलित करने की कोशिश कर रहा हूं। void matrix_mul(float *restrict r, float *a, float *b, int N, int accelerate){ #pra

    7गर्मी

    4उत्तर

    मैं समांतर प्रोग्रामिंग में शुरुआत कर रहा हूं। मेरे पास एक प्रश्न है जो मूर्खतापूर्ण प्रतीत हो सकता है लेकिन जब मैंने इसे बाहर निकाला तो मुझे एक निश्चित जवाब नहीं मिला। जीपीयू कंप्यूटिंग में एक डिवाइस

    6गर्मी

    3उत्तर

    समय एक शाखा एक CUDA या OpenCL कार्यक्रम में आवश्यक है, की तरह के अधिकांश: for (int i=0; i<width; i++) { if(i % threadIdx.x == 0) quantity += i*i; } कोड हमेशा (या कम से कम, ज्यादातर समय)