it-swarm.com.de

NVIDIA-SMI ist fehlgeschlagen, da keine Kommunikation mit dem NVIDIA-Treiber möglich ist. Stellen Sie sicher, dass der neueste NVIDIA-Treiber installiert ist und ausgeführt wird

Ich habe CUDA soeben in einem Notebook installiert:

Sudo apt-get install cuda

Wie gesagt hier .

Die Kompilierung funktioniert einwandfrei, aber beim Versuch, sie auszuführen, ist das folgende Problem aufgetreten: CUDA-Fehler bei file.cu:128 code = 35 (cudaErrorInsquateDriver) "cudaStreamCreate (& (stream [i])"

Meine NVCC-Version:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Tue_Jan_10_13:22:03_CST_2017
Cuda compilation tools, release 8.0, V8.0.61

Grafikkarten-Info:

lspci | egrep 'VGA|3D'
00:02.0 VGA compatible controller: Intel Corporation Skylake Integrated Graphics (rev 06)
02:00.0 3D controller: NVIDIA Corporation GM107M [GeForce GTX 960M] (rev a2)

Ich habe auch VirtualGL, Bumblebee-Nvidia, Primus, Freeglut3-Dev installiert. Nach dies .

Wenn ich versuche, etwas auf Hummeln laufen zu lassen, habe ich dieses: optirun glxspheres64

[   41.413478] [ERROR]Cannot access secondary GPU - error: Could not load GPU driver
[   41.413520] [ERROR]Aborting because fallback start is disabled.

nVIDIA-Treiber funktioniert nicht.

nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

Es sieht aus wie die NVIDIA 375-Version installiert ist, aber ich kann nicht machen, dass es funktioniert.

whereis nvidia
nvidia: /usr/lib/nvidia /usr/share/nvidia /usr/src/nvidia-375-375.66/nvidia

Und ein paar Fahrerinfos.

modinfo nvidia_375
filename:       /lib/modules/4.8.0-54-generic/updates/dkms/nvidia_375.ko
alias:          char-major-195-*
version:        375.66
supported:      external
license:        NVIDIA
srcversion:     68751AFD79A210CEFFB8758
alias:          pci:v000010DEd00000E00sv*sd*bc04sc80i00*
alias:          pci:v000010DEd*sv*sd*bc03sc02i00*
alias:          pci:v000010DEd*sv*sd*bc03sc00i00*
depends:        
vermagic:       4.8.0-54-generic SMP mod_unload modversions 
parm:           NVreg_Mobile:int
parm:           NVreg_ResmanDebugLevel:int
parm:           NVreg_RmLogonRC:int
parm:           NVreg_ModifyDeviceFiles:int
parm:           NVreg_DeviceFileUID:int
parm:           NVreg_DeviceFileGID:int
parm:           NVreg_DeviceFileMode:int
parm:           NVreg_UpdateMemoryTypes:int
parm:           NVreg_InitializeSystemMemoryAllocations:int
parm:           NVreg_UsePageAttributeTable:int
parm:           NVreg_MapRegistersEarly:int
parm:           NVreg_RegisterForACPIEvents:int
parm:           NVreg_CheckPCIConfigSpace:int
parm:           NVreg_EnablePCIeGen3:int
parm:           NVreg_EnableMSI:int
parm:           NVreg_TCEBypassMode:int
parm:           NVreg_UseThreadedInterrupts:int
parm:           NVreg_MemoryPoolSize:int
parm:           NVreg_RegistryDwords:charp
parm:           NVreg_RmMsg:charp
parm:           NVreg_AssignGpus:charp

Ich denke, es kann ein Problem mit der Treiberversion sein:

dpkg -l | grep nvidia
ii  bumblebee-nvidia                            3.2.1-10                                      AMD64        NVIDIA Optimus support using the proprietary NVIDIA driver
ii  nvidia-375                                  375.66-0ubuntu0.16.04.1                       AMD64        NVIDIA binary driver - version 375.66
ii  nvidia-375-dev                              375.66-0ubuntu0.16.04.1                       AMD64        NVIDIA binary Xorg driver development files
ii  nvidia-modprobe                             375.51-0ubuntu1                               AMD64        Load the NVIDIA kernel driver and create device files
ii  nvidia-opencl-icd-375                       375.66-0ubuntu0.16.04.1                       AMD64        NVIDIA OpenCL ICD
ii  nvidia-prime                                0.8.2                                         AMD64        Tools to enable NVIDIA's Prime

Was vermisse ich?

9
Rodolfo

Wenn Ihr nvidia-smi nicht kommuniziert, aber Sie den Treiber so oft installiert haben, aktivieren Sie prime-select.

  1. Führen Sie prime-select query aus, um alle möglichen Optionen abzurufen. Sie sollten mindestens nvidia | intel sehen.
  2. Wählen Sie prime-select nvidia.
  3. Wenn nvidia is already selected angezeigt wird, wählen Sie einen anderen aus, z. prime-select intel, dann zurück zu nvidia prime-select nvidia
  4. Starten Sie neu und überprüfen Sie nvidia-smi.
5
Phuc Le

Möglicherweise möchten Sie das cuda-Toolkit installieren. Verwenden Sie den folgenden Befehl, um es zu installieren.

Sudo apt install nvidia-cuda-toolkit

Starten Sie den Computer nach Abschluss der Installation neu. nvidia-smi sollte funktionieren.

3
Jack Chan

Ich habe den Secure Boot deaktiviert und es hat ziemlich gut funktioniert.

@ Rod-Smith beantwortete eine andere Frage genauer zu erklären, wie es geht, ist im Grunde eine Setup-Konfiguration, aber er schreibt auch einen guten Artikel darüber, wie man das in hier .

3
Rodolfo

Für zukünftige Leser:

Ich bin auf einer Instanz einer virtuellen Maschine (Google Cloud Platform).

und ich folge diese Übersicht , um Cuda und CuDNn auf meiner VM zu installieren.

Ich musste den Teil CuDNn manuell hochladen. (Stell es einfach da raus.)

Nun zum Fehler:

Ich hatte dieses Problem, aber ein vollständiger Neustart der Instanz erledigte den Job. Und mit einem vollständigen Neustart meine ich, die Instanz zu stoppen und wieder einzuschalten.

Ich hoffe das hilft jemandem.

0