pycuda

    6गर्मी

    1उत्तर

    में बराबर समतुल्य मैं पाइथन में फिट वैल्यू इटरेशन (एफवीआई) निष्पादित करने की कोशिश कर रहा हूं (जिसमें टुकड़े की रैखिक इंटरपोलेशन का उपयोग करके 5 आयामी फ़ंक्शन का अनुमान लगाया जा रहा है)। scipy.interpo

    5गर्मी

    2उत्तर

    क्या हमारे पास थानो में numpy.max(X, axis=None) के संस्करण की एक GPU त्वरित है। मैंने प्रलेखन में देखा और theano.tensor.max(X, axis=None) पाया, लेकिन यह numpy कार्यान्वयन से 4-5 गुना धीमी है। मैं आपको

    6गर्मी

    2उत्तर

    मेरे पर्यावरण: मैं Hortonworks HDP 2.4 का उपयोग कर रहा Ubuntu 14.04 के साथ 4 g2.2xlarge मामलों की एक छोटी एडब्ल्यूएस EC2 क्लस्टर पर स्पार्क 1.6.1 के साथ। प्रत्येक उदाहरण में सीयूडीए 7.5, एनाकोंडा पायथ

    6गर्मी

    1उत्तर

    मैं, CUDA के साथ एक अजीब समस्या नीचे स्निपेट में, #include <stdio.h> #define OUTPUT_SIZE 26 typedef $PRECISION REAL; extern "C" { __global__ void test_coeff (REAL* results) {

    6गर्मी

    1उत्तर

    पर सी ++/सीयूडीए कक्षा उत्तीर्ण करने के लिए मेरे पास सी ++ में लिखी गई एक कक्षा है जो cuda_runtime.h से कुछ परिभाषाओं का भी उपयोग करती है, यह एडीओएल-सी नामक ओपनसोर्स प्रोजेक्ट का एक हिस्सा है, आप here

    5गर्मी

    1उत्तर

    मैं सिर्फ pyCuda, स्थापित किया है जब मैं संकलन करने का प्रयास करें: आयात pycuda.autoinit drv आयात numpy के रूप में आयात pycuda.driver from pycuda.compiler import SourceModule mod = SourceModule("""

    8गर्मी

    1उत्तर

    मैं वर्तमान में मशीन सीखने एल्गोरिदम के प्रदर्शन में सुधार करने के लिए जीपीयू के साथ प्रोग्रामिंग सीख रहा हूं। शुरू में मैं शुद्ध सी के साथ CUDA प्रोग्रामिंग जानने की कोशिश, तो मैं pycuda जो मेरे लिए