it-swarm.com.de

'Nvidia_352' konnte nicht eingefügt werden: Kein solches Gerät

Ich versuche, caffe auf Linux Ubuntu auszuführen. Nach der Installation führe ich caffe in gpu aus und der Fehler ist 

I0910 13:28:13.606891 10629 caffe.cpp:296] Use GPU with device ID 0
modprobe: ERROR: could not insert 'nvidia_352': No such device
F0910 13:28:13.728612 10629 common.cpp:142] Check failed: error == cudaSuccess (38 vs. 0)  no CUDA-capable device is detected
*** Check failure stack trace: ***
    @     0x7ffd3b9a7daa  (unknown)
    @     0x7ffd3b9a7ce4  (unknown)
    @     0x7ffd3b9a76e6  (unknown)
    @     0x7ffd3b9aa687  (unknown)
    @     0x7ffd3bf91cb5  caffe::Caffe::SetDevice()
    @           0x40a5a7  time()
    @           0x4080f8  main
    @     0x7ffd3aeb9ec5  (unknown)
    @           0x408618  (unknown)
    @              (nil)  (unknown)
Aborted (core dumped)

Mein NVIDIA-Treiber ist 352.41 ..__ Ich habe 352 installiert und es ist die neueste Version installiert.

Sudo apt-get install nvidia-352[Sudo] 
Reading package lists... Done
Building dependency tree       
Reading state information... Done
nvidia-352 is already the newest version.
The following packages were automatically installed and are no longer required:
  account-plugin-windows-live libupstart1
Use 'apt-get autoremove' to remove them.
0 upgraded, 0 newly installed, 0 to remove and 31 not upgraded.

Mein Ubuntu hat den NVIDIA-Treiber 352 und warum habe ich einen Fehler

I0910 13:28:13.606891 10629 caffe.cpp:296] Use GPU with device ID 0
    modprobe: ERROR: could not insert 'nvidia_352': No such device
    F0910 13:28:13.728612 10629 common.cpp:142] Check failed: error == cudaSuccess (38 vs. 0)  no CUDA-capable device is detected

Ich habe geprüft, ob ich ein CUDA-fähiges Gerät habe

lspci | grep -i nvidia
05:00.0 VGA compatible controller: NVIDIA Corporation GK107GL [Quadro K2000] (rev a1)
05:00.1 Audio device: NVIDIA Corporation GK107 HDMI Audio Controller (rev a1)

Ich habe ein CUDA-fähiges Gerät und warum bekomme ich den Fehler?

EDIT 1: Ja, mein Test mit ./deviceQuery ist fehlgeschlagen.

../NVIDIA_CUDA-7.5_Samples/bin/x86_64/linux/release/deviceQuery Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

cudaGetDeviceCount returned 38
-> no CUDA-capable device is detected
Result = FAIL

Ich habe im dev/Ordner nachgesehen, ich habe nvidia0.

crwxrwxrwx  1 root root    195,   0 Sep 10 16:51 nvidia0
crw-rw-rw-  1 root root    195, 255 Sep 10 16:51 nvidiactl

Mein nvcc -V check hat mir gegeben

[email protected]:/dev$ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2015 NVIDIA Corporation
Built on Tue_Aug_11_14:27:32_CDT_2015
Cuda compilation tools, release 7.5, V7.5.17

Dann meine Versionsprüfung

[email protected]:/dev$ cat /proc/driver/nvidia/version
NVRM version: NVIDIA UNIX x86_64 Kernel Module  352.41  Fri Aug 21 23:09:52 PDT 2015
GCC version:  gcc version 4.8.4 (Ubuntu 4.8.4-2ubuntu1~14.04) 

Was könnte falsch sein?

17
batuman

Jetzt ist das Problem gelöst. Ich habe Sudo dpkg --list | grep nvidia.__ überprüft. Ich habe festgestellt, dass mein Kernel 352.41 hat, aber der Client hat 304.12 . Also habe ich Sudo apt-get remove --purge nvidia-*. Es wurden alle Pakete entfernt . Installieren Sie dann 352.41 als

$ Sudo add-apt-repository ppa:xorg-edgers/ppa -y
$ Sudo apt-get update
$ Sudo apt-get install nvidia-352

Nachdem 

$ Sudo dpkg --list | grep nvidia
rc nvidia-304 304.128-0ubuntu0~gpu14.04.2 AMD64 NVIDIA legacy binary driver - version 304.128
rc nvidia-304-updates 304.125-0ubuntu0.0.2 AMD64 NVIDIA legacy binary driver - version 304.125
ii nvidia-352 352.41-0ubuntu0~gpu14.04.1 AMD64 NVIDIA binary driver - version 352.41
rc nvidia-opencl-icd-304 304.128-0ubuntu0~gpu14.04.2 AMD64 NVIDIA OpenCL ICD
rc nvidia-opencl-icd-304-updates 304.125-0ubuntu0.0.2 AMD64 NVIDIA OpenCL ICD
ii nvidia-opencl-icd-352 352.41-0ubuntu0~gpu14.04.1 AMD64 NVIDIA OpenCL ICD
ii nvidia-prime 0.6.2 AMD64 Tools to enable NVIDIA's Prime
ii nvidia-settings 355.11-0ubuntu0~gpu14.04.1 AMD64 Tool for configuring the NVIDIA graphics driver

Nun stimmt die Version mit ..__ überein. Dann ./deviceQuery und alle funktionieren wie erwartet . Danke

11
batuman

Ich habe auch dieses Problem. Die erneute Installation der nvidia-Treiber hat das Problem nicht gelöst. 

Schließlich löste ich dieses Problem, indem ich zwei Kernel-Parameter mit grub hinzufügte.

hinzufügen in:

GRUB_CMDLINE_LINUX_DEFAULT

mit:

pci=nocrs pci=realloc

Ich denke, das ist eine Kollision zwischen cuda7.5 und kernel3.19.

2
SPWW

Wenn Sie Videos von einem Nicht-Nvidia-Gerät anzeigen, aber einen Treiber installiert haben, müssen Sie diesen mit dem Flag "--no-opengl-files" installieren, damit Gnome funktioniert.

Ich empfehle, einen separaten Treiber herunterzuladen und manuell zu installieren, indem Sie sich bei der Konsole anmelden:

1. Alt Ctrl F2/f3/f4/f5 to get to console.
2. “init 3”  to kill UI
3. relogin if necessary to console
4. wget http://us.download.nvidia.com/tesla/418.67/NVIDIA-Linux-

treiber x86_64-418.67.run

5. sh NVIDIA-Linux-x86_64-418.67.run --no-opengl-files
6. After installation - reboot
0
batuman

Eine andere Möglichkeit ist die Installation mit der .run-Datei . Dies muss zuerst den X-Server beenden Der X-Server wird wie folgt beendet.

Make sure you are logged out.
Hit CTRL+ALT+F1 and login using your credentials.
kill your current X server session by typing Sudo service lightdm stop or Sudo stop lightdm
Enter runlevel 3 (or 5) by typing Sudo init 3 (or Sudo init 5) and install your .run file.
You might be required to reboot when the installation finishes. If not, run Sudo service start lightdm or Sudo start lightdm to start your X server again.

Dann run .run file as Sudo sh xxxxx.run

Sie erhalten möglicherweise einen Fehler als The distribution-provided pre-install script failed! Are you sure you want to continue?. Dann die Installation abbrechen und 

disable the "Nouveau kernel driver" as Sudo update-initramfs -u

Starten Sie dann das System neu und redo stop X server, enter runlevel 3 and do Sudo sh xxxx.run again.

Dieses Mal können Sie die Nachricht ignorieren und mit dieser fehlgeschlagenen Vorgabemeldung fortfahren .. __ Dann können Sie den Nvidia-Treiber von der RUN-Datei installieren.

0
batuman