NVIDIA-SMIは、NVIDIAドライバーと通信できなかったため失敗しました。最新のNVIDIAドライバーがインストールされ、実行されていることを確認してください


22

このようなノートブックにCUDAをインストールしました:

sudo apt-get install cuda

ここで言ったように

コンパイルは問題ありませんが、実行しようとすると、次の問題が発生しました:file.cu:128 code = 35(cudaErrorInsufficientDriver) "cudaStreamCreate(&(stream [i]))"でのCUDAエラー

私のnvccバージョン:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Tue_Jan_10_13:22:03_CST_2017
Cuda compilation tools, release 8.0, V8.0.61

グラフィックスカード情報:

lspci | egrep 'VGA|3D'
00:02.0 VGA compatible controller: Intel Corporation Skylake Integrated Graphics (rev 06)
02:00.0 3D controller: NVIDIA Corporation GM107M [GeForce GTX 960M] (rev a2)

VirtualGL、bumblebee-nvidia、primus、freeglut3-devもインストールしました。これに続い

マルハナバチで何かを実行しようとすると、次のようになりました:optirun glxspheres64

[   41.413478] [ERROR]Cannot access secondary GPU - error: Could not load GPU driver
[   41.413520] [ERROR]Aborting because fallback start is disabled.

nvidiaドライバーが機能していません。

nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

nvidia 375バージョンがインストールされているように見えますが、動作させることはできません。

whereis nvidia
nvidia: /usr/lib/nvidia /usr/share/nvidia /usr/src/nvidia-375-375.66/nvidia

そして、いくつかのドライバー情報。

modinfo nvidia_375
filename:       /lib/modules/4.8.0-54-generic/updates/dkms/nvidia_375.ko
alias:          char-major-195-*
version:        375.66
supported:      external
license:        NVIDIA
srcversion:     68751AFD79A210CEFFB8758
alias:          pci:v000010DEd00000E00sv*sd*bc04sc80i00*
alias:          pci:v000010DEd*sv*sd*bc03sc02i00*
alias:          pci:v000010DEd*sv*sd*bc03sc00i00*
depends:        
vermagic:       4.8.0-54-generic SMP mod_unload modversions 
parm:           NVreg_Mobile:int
parm:           NVreg_ResmanDebugLevel:int
parm:           NVreg_RmLogonRC:int
parm:           NVreg_ModifyDeviceFiles:int
parm:           NVreg_DeviceFileUID:int
parm:           NVreg_DeviceFileGID:int
parm:           NVreg_DeviceFileMode:int
parm:           NVreg_UpdateMemoryTypes:int
parm:           NVreg_InitializeSystemMemoryAllocations:int
parm:           NVreg_UsePageAttributeTable:int
parm:           NVreg_MapRegistersEarly:int
parm:           NVreg_RegisterForACPIEvents:int
parm:           NVreg_CheckPCIConfigSpace:int
parm:           NVreg_EnablePCIeGen3:int
parm:           NVreg_EnableMSI:int
parm:           NVreg_TCEBypassMode:int
parm:           NVreg_UseThreadedInterrupts:int
parm:           NVreg_MemoryPoolSize:int
parm:           NVreg_RegistryDwords:charp
parm:           NVreg_RmMsg:charp
parm:           NVreg_AssignGpus:charp

ドライバーのバージョンに問題がある可能性があります。

dpkg -l | grep nvidia
ii  bumblebee-nvidia                            3.2.1-10                                      amd64        NVIDIA Optimus support using the proprietary NVIDIA driver
ii  nvidia-375                                  375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary driver - version 375.66
ii  nvidia-375-dev                              375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary Xorg driver development files
ii  nvidia-modprobe                             375.51-0ubuntu1                               amd64        Load the NVIDIA kernel driver and create device files
ii  nvidia-opencl-icd-375                       375.66-0ubuntu0.16.04.1                       amd64        NVIDIA OpenCL ICD
ii  nvidia-prime                                0.8.2                                         amd64        Tools to enable NVIDIA's Prime

私は何が欠けていますか?


ドライバーはどのようにインストールしますか?
チャーリーパーカー

同じエラーに直面し、どの回答も機能しませんでした。動作したのは簡単でした$ reboot now
darthbhyrava

回答:


14

あなたがいる場合nvidia-smiの通信に失敗しましたが、あなたは、ドライバそう何回も、チェックをインストールしましたprime-select

  1. 実行prime-select queryしてすべての可能なオプションを取得します。少なくとも表示されるはずnvidia | intelです。
  2. を選択しprime-select nvidiaます。
  3. の場合nvidia is already selected、別のものを選択します。たとえばprime-select intel、nvidiaに戻ります。prime-select nvidia
  4. 再起動して確認しnvidia-smiます。

助けて頂きました。ありがとう!
ヤロスラフシューベルト

ああ、ええと、prime-select queryでもリストインテル、私は...私は今、2つの問題があると思いませんでした
Inspi

11

cudaツールキットをインストールすることもできます。次のコマンドを使用してインストールします。

sudo apt install nvidia-cuda-toolkit

インストールが完了したら、マシンを再起動します。nvidia-smi動作するはずです。


私のために働く!!
-x0v

これは私のために働く
-Sundeep

5
ここでは機能しませんでした
ビルKotsias

1
10以上のcudaがある場合は、これを行わないでください。CUDAPPAなしで現在ubuntuで使用可能なcudaを9にダウングレードします。
ロレトパリシ

やってsudo apt-get purge nvidia-*、その後、上記の行は、CUDAは私のために関連するすべてのものを固定し、前にCUDA 10.1で430ドライバをインストール
Dinari

5

セキュアブートを無効にすると、かなりうまくいきました。

@ rod-smith は、それを行う方法をより具体的に説明する別の質問を投げかけました。基本的にはセットアップ構成ですが、彼はここでその方法についての良い記事も書いています


2
nvidiaドライバー390を使用することもできました!セキュアブート、thxが原因だとは思わなかった:)
samutamm

セキュアブートを無効にしたUEFIモードは、すでにここで実行されています。=)残念ながら、すべての人には機能しないようです。
レナンウィリアンプラド

3

上記の@Rodolfoの回答にコメントすることはできないため(評判が不十分)、新しい回答を追加しています。

マシン上でセキュアブートを構成する必要がありました、OSに合わせて。Ubuntu 18.04を実行しているASUSメインボードがあり、NVIDIA CUDA 10.1 Update 2をパッケージ化されたNVIDIAドライバーでインストールしようとしました。上記と同じ問題に直面しました。判明したように、セキュアブートはWindows UEFIモードに設定されていました。それを他のOSに変更することで修正されました。


1
おかげでSecure Boot、Windows / BIOSの自動更新中に自動的に再び有効になったものを無効にする必要がありました!!! 現在、nvidiaは正常に動作します。
ビルKotsias

セキュアブートを他のOSに変更した方法を説明してもらえますか?
Inspi

1
@BillKotsiasありがとう!:D
マレック

1

将来の読者向け:

仮想マシンインスタンス(Google Cloud Platform)を使用しています

そして私はフォローしています この要点、VM にインストールCudaCuDNnます。

手動でアップロードする必要がありました CuDNnパーツ。(ただそこに置いてください。)

さて、エラーになりました:

私はこの問題を抱えていましたが、インスタンスの完全な再起動が仕事をしました。そして、完全な再起動とは、インスタンスを停止して再びオンにすることを意味します。

これが誰かの助けになることを願っています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.