it-swarm.com.de

Ubuntu 16.04, CUDA 8 - Die CUDA-Treiberversion reicht für die CUDA-Laufzeitversion nicht aus

Ich habe die neuesten nvidia-Treiber (375.26) manuell installiert und CUDA mit cuda_8.0.44_linux.run installiert (die Treiberinstallation dort überspringen, da die gebündelten Treiber älter sind, glaube ich, 367).

Das Ausführen von deviceQuery in CUDA-Beispielen führt jedoch zu folgendem Fehler:

~/cudasamples/NVIDIA_CUDA-8.0_Samples/1_Utilities/deviceQuery$ ./deviceQuery 
./deviceQuery Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

cudaGetDeviceCount returned 35
-> CUDA driver version is insufficient for CUDA runtime version
Result = FAIL

Versions Information:

$ nvcc --version

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Sun_Sep__4_22:14:01_CDT_2016
Cuda compilation tools, release 8.0, V8.0.44

$ nvidia-smi
Sat Dec 31 17:25:03 2016       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 375.26                 Driver Version: 375.26                    |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 1080    Off  | 0000:01:00.0      On |                  N/A |
|  0%   39C    P8    11W / 230W |    464MiB /  8110MiB |      1%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID  Type  Process name                               Usage      |
|=============================================================================|
|    0       974    G   /usr/lib/xorg/Xorg                             193MiB |
|    0      1816    G   compiz                                         172MiB |
|    0      2178    G   ...ignDownloads/Enabled/MaterialDesignUserMa    96MiB |
+-----------------------------------------------------------------------------+

$  cat /proc/driver/nvidia/version 
NVRM version: NVIDIA UNIX x86_64 Kernel Module  375.26  Thu Dec  8 18:36:43 PST 2016
GCC version:  gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.4) 

Die Antwort auf ähnliche Probleme bestand in der Aktualisierung der NVIDIA-Anzeigetreiber, obwohl dies in meinem Fall bereits geschehen ist. Hat jemand irgendwelche Ideen? Vielen Dank.

14
vambo

Laufen 

Sudo apt-get purge nvidia-*

und installieren Sie die Treiber erneut mit 

Sudo apt-get install nvidia-375

ich habe es gelöst. Zum ersten Mal habe ich die Treiber über die GUI (Registerkarte Zusätzliche Treiber in Software & Updates) zum ersten Mal aktualisiert.

18
vambo

Überprüfen Sie zuerst "CUDA-Toolkit und kompatible Treiberversionen" von hier und stellen Sie sicher, dass Ihre cuda-Toolkit-Version mit Ihrer cuda-Treiberversion kompatibel ist, z. Wenn Ihre Treiberversion nvidia-390 ist, muss Ihre cuda-Version niedriger als CUDA 9.1 sein.
Dann zurück zu diesem Thema. Dieses Problem wird verursacht durch "Ihre cuda-Treiberversion stimmt nicht mit Ihrer cuda-Version überein, und Ihre lokale CUDA-Version unterscheidet sich möglicherweise auch von der CUDA-Laufzeitversion (cuda-Version in bestimmten virtuellen Umgebungen)."
Das gleiche Problem trat auf, als ich versuchte, tensorflow-gpu unter der von conda erstellten Umgebung von "tensorflow_gpuenv" auszuführen und zu testen, ob das Gerät "gpu: 0" funktionierte. Meine Treiberversion ist nvidia-390 Und ich habe bereits cuda 9.0 Installiert, daher macht es keinen Sinn, dieses seltsame Problem anzusprechen. Ich fand schließlich den Grund, dass die cuda-Version in der virtuellen Conda-Umgebung cuda 9.2 Ist, was nicht mit nvidia-390 Kompatibel ist. Ich habe das Problem folgendermaßen in ubuntu 18.04 Gelöst:

  • cuda-Treiberversion prüfen
    ~$ nvidia-smi Oder ~$ cat /proc/driver/nvidia/version
  • überprüfe die lokale cuda Version
    ~$ nvcc --version Oder ~$ cat /usr/local/cuda/version.txt
  • überprüfe lokale cudnn Version
    ~$ cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2


  • cuda-Version in virtueller Umgebung prüfen
    ~$ conda list Sie können so etwas sehen:
    cudatoolkit 9.2 0
    cudnn 7.3.1 cuda9.2_0
    Sie stellen möglicherweise fest, dass sich die cuda-Version in der virtuellen Umgebung von der lokalen cuda-Version unterscheidet und nicht mit der Treiberversion nvidia-390 kompatibel ist.

Also cuda in der virtuellen Umgebung neu installieren:

  • cuda neu installieren: ~$ conda install cudatoolkit=8.0
    (Ändern Sie die Versionsnummer '8.0' in eine andere Versionsnummer, die Ihrer Treiberversion entspricht, und Ihre cudnn-Version wird automatisch aktualisiert, um der neuen Version cuda zu entsprechen.)
11
Hu Xixi

Ich habe die Anweisungen auf dieser Seite befolgt und es funktioniert für mich.

https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_Arch=x86_64&target_distro=Ubuntu&target_version=1604&target_type=debnetwork

Laden Sie zunächst das Installationsprogramm für Linux Ubuntu 16.04 x86_64 herunter.

Führen Sie als Nächstes folgende Schritte aus, um Linux Ubuntu zu installieren:

  1. Sudo dpkg -i cuda-repo-ubuntu1604_9.2.148-1_AMD64.deb

  2. Sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/7fa2af80.pub

  3. Sudo apt-get update

  4. Sudo apt-get install cuda

1
aysljc

Ich habe diesen Fehler unter Ubuntu 16.04 erhalten, da ich noch den Open-Source-X.Org-Grafiktreiber verwendet habe. Der Fehler wurde behoben, als ich zum NVIDIA-Binärtreiber wechselte.

Ich habe die Treibereinstellungen gefunden, indem ich die Systemeinstellungen geöffnet habe und dann auf Software & Updates geklickt habe. Die Grafiktreiber befinden sich auf der Registerkarte Zusätzliche Treiber.

1
Don Kirkby

Mein Cent,

das Problem hängt möglicherweise mit dem ausgewählten GPU-Modus (Leistung/Energiesparmodus) zusammen. Im Perfomance-Modus wird die Nvidia-GPU verwendet, und der Energiesparmodus wird in die integrierte Intel-GPU geändert. Wenn Sie (mit dem Dienstprogramm nvidia-settings in den Konfigurationen "PRIME Profiles") den Energiesparmodus (integrierte Intel-GPU) auswählen und das Skript deviceQuery ausführen ..., erhalten Sie diesen Fehler

-> CUDA driver version is insufficient for CUDA runtime version

Dieser Fehler ist jedoch irreführend. Durch Auswählen wird der Leistungsmodus (NVIDIA GPU) mit dem Dienstprogramm nvidia-settings zurückgesetzt, und das Problem verschwindet.

In meinem Fall Ich hatte kein Problem mit der Treiberversion, aber ich muss einfach die Nvidia-GPU erneut aktivieren. 

Grüße

Ps: Die Auswahl ist verfügbar, wenn Prime-relevantes Zeug installiert ist (Sie benötigen den proprietären Treiber von Nvidia). Weitere Details: https://askubuntu.com/questions/858030/nvidia-prime-in-nvidia-x-server-settings-in-16-04-1

1
Fabiano Tarlao

Ich hatte das gleiche Problem. Ich hatte die Version nvidia-390 auf Ubuntu 18.04.2 LTS installiert. Meine Grafikkarte ist GeForce GTX 1080 und verwendet Tensorflow 1.12.0. Ich habe dieses Problem erfolgreich gelöst, indem ich die alte Version entfernt habe:

Sudo apt-get purge nvidia-*

Und dann die Version 418 installieren

Sudo apt-get install nvidia-driver-418 nvidia-settings

0

Wenn Sie den erforderlichen NVidia-Treiber bereits installiert haben, können Sie ihn anhand der Antwort von # Fabiano-Tarlao in der Linux-Befehlszeile auswählen:

Sudo Prime-Select Nvidia

0
ashok3t

Ich benutze Anaconda, nachdem ich Keras-GPU über Conda installiert habe, wurde automatisch die neueste Version von Cuda verwendet, die nicht mit meinem System kompatibel war.

Sie können die Liste der installierten Pakete in Anaconda über anzeigen

conda list

In meinem Fall unterstützte Version 10.0, aber Anaconda installierte die neueste Version 10.1. Wenn dies der Fall ist, müssen Sie Cuda in Anaconda-Umgebung mit unterstützter Version neu installieren.

0
Piyush jain