2015-09-10 8 views
16

मैं Linux Ubuntu पर चलाने की कोशिश कर रहा हूं। स्थापना के बाद, मैं GPU में Caffe चलाने के लिए और त्रुटि'nvidia_352' सम्मिलित नहीं किया जा सका: ऐसा कोई डिवाइस

I0910 13:28:13.606891 10629 caffe.cpp:296] Use GPU with device ID 0 
modprobe: ERROR: could not insert 'nvidia_352': No such device 
F0910 13:28:13.728612 10629 common.cpp:142] Check failed: error == cudaSuccess (38 vs. 0) no CUDA-capable device is detected 
*** Check failure stack trace: *** 
    @  0x7ffd3b9a7daa (unknown) 
    @  0x7ffd3b9a7ce4 (unknown) 
    @  0x7ffd3b9a76e6 (unknown) 
    @  0x7ffd3b9aa687 (unknown) 
    @  0x7ffd3bf91cb5 caffe::Caffe::SetDevice() 
    @   0x40a5a7 time() 
    @   0x4080f8 main 
    @  0x7ffd3aeb9ec5 (unknown) 
    @   0x408618 (unknown) 
    @    (nil) (unknown) 
Aborted (core dumped) 

मेरे NVIDIA ड्राइवर 352.41 है। मैंने 352 स्थापित किया और यह नवीनतम संस्करण स्थापित है।

sudo apt-get install nvidia-352[sudo] 
Reading package lists... Done 
Building dependency tree  
Reading state information... Done 
nvidia-352 is already the newest version. 
The following packages were automatically installed and are no longer required: 
    account-plugin-windows-live libupstart1 
Use 'apt-get autoremove' to remove them. 
0 upgraded, 0 newly installed, 0 to remove and 31 not upgraded. 

मेरे Ubuntu NVIDIA ड्राइवर 352 है और यही कारण है कि मैं त्रुटि

I0910 13:28:13.606891 10629 caffe.cpp:296] Use GPU with device ID 0 
    modprobe: ERROR: could not insert 'nvidia_352': No such device 
    F0910 13:28:13.728612 10629 common.cpp:142] Check failed: error == cudaSuccess (38 vs. 0) no CUDA-capable device is detected 

जैसे मैं जाँच की है कि क्या मैं CUDA सक्षम डिवाइस है

lspci | grep -i nvidia 
05:00.0 VGA compatible controller: NVIDIA Corporation GK107GL [Quadro K2000] (rev a1) 
05:00.1 Audio device: NVIDIA Corporation GK107 HDMI Audio Controller (rev a1) 

जैसे मैं CUDA सक्षम डिवाइस है और यही कारण है कि मैं त्रुटि प्राप्त करें?

संपादित करें 1: हाँ मेरा परीक्षण ./deviceQuery के साथ विफल रहा।

../NVIDIA_CUDA-7.5_Samples/bin/x86_64/linux/release/deviceQuery Starting... 

CUDA Device Query (Runtime API) version (CUDART static linking) 

cudaGetDeviceCount returned 38 
-> no CUDA-capable device is detected 
Result = FAIL 

मैंने dev/फ़ोल्डर में चेक किया है, मेरे पास nvidia0 है।

crwxrwxrwx 1 root root 195, 0 Sep 10 16:51 nvidia0 
crw-rw-rw- 1 root root 195, 255 Sep 10 16:51 nvidiactl 

मेरे NVCC वी की जांच मुझे दिया

[email protected]:/dev$ nvcc -V 
nvcc: NVIDIA (R) Cuda compiler driver 
Copyright (c) 2005-2015 NVIDIA Corporation 
Built on Tue_Aug_11_14:27:32_CDT_2015 
Cuda compilation tools, release 7.5, V7.5.17 

तब मेरे संस्करण की जांच

[email protected]:/dev$ cat /proc/driver/nvidia/version 
NVRM version: NVIDIA UNIX x86_64 Kernel Module 352.41 Fri Aug 21 23:09:52 PDT 2015 
GCC version: gcc version 4.8.4 (Ubuntu 4.8.4-2ubuntu1~14.04) 

क्या गलत हो सकता है?

+1

एक पल के लिए कैफे को छोड़कर, क्या आप भी सुनिश्चित हैं कि आपकी मूल CUDA स्थापना सही तरीके से काम करती है? – talonmies

+1

बेशक, मैंने CUDA7.5 स्थापित किया है। सभी lib और हेडर /usr/local/cuda7.5 में स्थापित हैं। सभी पथ निर्यात PATH =/usr/local/cuda-7.5/bin: $ PATH $ निर्यात LD_LIBRARY_PATH =/usr/local/cuda-7.5/lib64: $ LD_LIBRARY_PATH के रूप में निर्यात किए जाते हैं। मैंने सफलतापूर्वक कैफे स्थापित किया। – batuman

+2

यही वह नहीं है जिसे मैंने पूछा था। क्या आप संकुचित और सफलतापूर्वक एक सरल CUDA एप्लिकेशन चला सकते हैं, जैसे कि CUDA टूलकिट से नमूने में से एक? – talonmies

उत्तर

11

अब समस्या हल हो गई है। मैंने sudo dpkg --list | grep nvidia चेक किया क्योंकि मुझे पता चला कि मेरे कर्नेल में 352.41 है, लेकिन ग्राहक के पास 304.12 है। तो मैंने sudo apt-get remove --purge nvidia-* किया था। यह सभी संकुल हटा दिया। फिर, अब संस्करण मैचों 352.41 के रूप में

$ sudo add-apt-repository ppa:xorg-edgers/ppa -y 
$ sudo apt-get update 
$ sudo apt-get install nvidia-352 

उसके बाद

$ sudo dpkg --list | grep nvidia 
rc nvidia-304 304.128-0ubuntu0~gpu14.04.2 amd64 NVIDIA legacy binary driver - version 304.128 
rc nvidia-304-updates 304.125-0ubuntu0.0.2 amd64 NVIDIA legacy binary driver - version 304.125 
ii nvidia-352 352.41-0ubuntu0~gpu14.04.1 amd64 NVIDIA binary driver - version 352.41 
rc nvidia-opencl-icd-304 304.128-0ubuntu0~gpu14.04.2 amd64 NVIDIA OpenCL ICD 
rc nvidia-opencl-icd-304-updates 304.125-0ubuntu0.0.2 amd64 NVIDIA OpenCL ICD 
ii nvidia-opencl-icd-352 352.41-0ubuntu0~gpu14.04.1 amd64 NVIDIA OpenCL ICD 
ii nvidia-prime 0.6.2 amd64 Tools to enable NVIDIA's Prime 
ii nvidia-settings 355.11-0ubuntu0~gpu14.04.1 amd64 Tool for configuring the NVIDIA graphics driver 

स्थापित करें। फिर ./deviceQuery और अपेक्षित सभी कार्य। धन्यवाद

+0

http://askubuntu.com/questions/723632/nvidia-7300-le-driver-15-10-how-to-install-ubuntu-modprobe-error-could- मुझे पता नहीं है कि यह "निश्चित" है। –

2

मुझे यह समस्या भी है। और एनवीडिया ड्राइवरों को पुनः स्थापित करने से इस मुद्दे को हल नहीं किया गया।

अंत में, मैंने इस समस्या को ग्रब के साथ दो कर्नेल पैरामीटर जोड़कर हल किया। साथ

GRUB_CMDLINE_LINUX_DEFAULT 

:

में जोड़ने

pci=nocrs pci=realloc 

मुझे लगता है कि इस cuda7.5 और kernel3.19 के बीच टक्कर है।

+0

इसके अलावा [https://devtalk.nvidia.com/default/topic/838768/problems-with-geforce-gtx-980-on-asustek-g20aj/] nvidia मंच पर भी! – Heartinpiece

+0

'pci = nocrs pci = realloc' '/ etc/default/grub' में जोड़ें '# update-grub' – Heartinpiece

+0

GeForce 7 श्रृंखला 7300 LE:' $ lspci -vnn | grep -i VGA -A 12> कर्नेल ड्राइवर उपयोग में: nvidia'। अच्छा। लेकिन 'स्टार्टएक्स' और उबंटू-डेस्कटॉप जीयूआई लॉगिन अभी भी एकता के बिना एक स्क्रीन में परिणाम। : < –

-1

मुझे यह समस्या भी थी। उपर्युक्त उत्तर मेरे लिए काम नहीं करते थे। जब मैंने नवीनतम ड्राइवर (nvidia-364) स्थापित किया, तो यह काम किया।

sudo add-apt-repository ppa:xorg-edgers/ppa 
sudo apt-get update 
sudo apt-get install nvidia-364 

मुझे लगता है कि समस्या तब होती है जब हम gcc चालक मॉड्यूल और लिनक्स कर्नेल संकलित करने के लिए प्रयोग किया जाता है के विभिन्न संस्करण है: चलाने के लिए आदेश देता है।

संबंधित मुद्दे