gpgpu

    8गर्मी

    2उत्तर

    मैंने एक साधारण कर्नेल लागू किया जो किसी प्रकार का संकल्प है। मैंने इसे एनवीआईडीआईए जीटी 240 पर मापा। ओडीसीएल पर लिखे जाने पर सीयूडीए पर लिखा गया और 100 एमएस में 70 एमएस लगा। ठीक है, मैंने सोचा, एनवीआ

    24गर्मी

    6उत्तर

    आजादी के लिए स्वतंत्रता (डेस्कटॉप, क्लाउड, मोबाइल, ...) गति के मामले में GPGPU विकास के लिए ओपनसीएल का उपयोग करना बहुत अच्छा होगा। मुझे पता है कि Google एक विकल्प के रूप में रेंडरस्क्रिप्ट को धक्का दे

    6गर्मी

    2उत्तर

    पर eigenvalues ​​और eigenvectors की गणना के लिए खराब प्रदर्शन कुछ कोड में हमें समेकित वास्तविक matrices (एक्स = लांबा बीएक्स) के साथ सामान्यीकृत eigenvalue समस्या के लिए ऑटो वैक्टर और ऑटो मान प्राप्त

    6गर्मी

    1उत्तर

    मैं जीपीयू (अधिमानतः ओपनसीएल) के लिए एक प्रोग्राम लिखना चाहता हूं और गणना के एक बड़े हिस्से में थोड़ा सरणी (लंबे या int के रूप में पैक) में 1 की संख्या की गणना करना शामिल है। तो, आधुनिक सीपीयू पर मैं

    12गर्मी

    4उत्तर

    जैसा कि निम्न त्रुटि का तात्पर्य है, कर्नेल में होस्ट फ़ंक्शन ('रैंड') को कॉल करने की अनुमति नहीं है, और मुझे आश्चर्य है कि अगर ऐसा करने की आवश्यकता है तो इसके लिए कोई समाधान है या नहीं। error: callin

    5गर्मी

    1उत्तर

    मैं निम्नलिखित कर रहा हूँ के लिए __shared__ चर के लिए अनुमति नहीं है। संकलक प्रश्न के शीर्षक में बताए गए त्रुटि के रूप में फेंक रहा है। मैं वास्तव में नहीं समझता कि यह एक समस्या क्यों है?

    8गर्मी

    3उत्तर

    मैं ओपनसीएल में एक एल्गोरिदम लिख रहा हूं जिसमें मुझे डेटा के एक उचित भाग को याद रखने के लिए प्रत्येक कार्य इकाई की आवश्यकता होगी, long[70] और long[200] या प्रति कर्नेल के बीच कुछ कहें। हालिया एएमडी उप

    14गर्मी

    3उत्तर

    पर वीडियो फ्रेम डीकोड करें मैं आईफोन पर स्थानीय एमपीईजी -4 वीडियो के फ्रेम को डीकोड करने का सबसे तेज़ तरीका ढूंढ रहा हूं। मैं बस हर 10 वीं फ्रेम में पिक्सेल के चमकदार मूल्यों में रुचि रखता हूं। मुझे क

    5गर्मी

    1उत्तर

    मैं एक विशेष मैट्रिक्स समारोह के लिए OpenCL कोड के एक टुकड़े पर काम कर रहा हूँ: एक Dx1 वेक्टर v, दो DxD मैट्रिक्स A और B और एक निरंतर c के लिए, 1xD वेक्टर r लौट जहां r[i] = c * sum_over_j (v[j] * A[i]

    5गर्मी

    2उत्तर

    बनाम मैं सरल गिरी है? सभी ट्यूटोरियल का कहना है, कि वेक्टर प्रकार का उपयोग कर गणना को गति ... मेजबान पक्ष, स्मृति Float4 तर्क के लिए alocated पर 16 बाइट्स गठबंधन और global_work_size clEnqueueNDRangeKe