文档章节

Ubuntu 16.04安装NVIDIA的显卡驱动396和CUDA9.1

openthings
 openthings
发布于 2018/04/26 12:28
字数 1268
阅读 6457
收藏 0

Ubuntu安装NVIDIA的显卡驱动和CUDA Toolkit

NVIDIA TITAN V 采用均热板冷却并且风扇噪音很低。

Ubuntu(这里是用16.04LTS桌面版,如果是17.04及以后版本,因为使用的显示服务器不同,可能又会有所不同)安装NVIDIA的显卡驱动经常出现启动后死循环进不去系统的情况,这里推荐的方法可以安装最新的驱动(版本396)和Cuda Toolkit,在最新的Titan V显卡测试可用。

1、使用Ubuntu软件库安装(推荐)

  • 最简单的方法,安装Synaptic然后搜索NVIDIA,找一个最新的驱动安装。
sudo apt install synaptic
sudo synaptic

这样安装的驱动是经过Ubuntu测试过得,比较保险。不过,版本较旧一点,我安装的Ubuntu16.04 LTS里的NVidia驱动默认是384版本。

  • 可以直接安装NVidia的384版本的驱动(强烈推荐)
sudo apt install nvidia-384
  • 安装最新的396版本驱动,如下(Titan V测试可用)
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
sudo apt install nvidia-396

#开发使用
sudo apt install nvidia-396-dev
  • 如果从Nvidia官网下载安装,装完系统重启失败。我试了几次都失败,放弃。

2、安装CUDA驱动(注意选项)

安装CUDA驱动会自动安装图形卡驱动,可以从 https://developer.nvidia.com/cuda-downloads 下载安装,已经支持最新的Volta架构(目前只有采用V100芯片的Titan V图形卡和Tesla计算卡使用)。

#获取Cuda9.1安装文件文件和2018.5.5的补丁包:
wget -c https://developer.nvidia.com/compute/cuda/9.1/Prod/local_installers/cuda_9.1.85_387.26_linux
wget -c https://developer.nvidia.com/compute/cuda/9.1/Prod/patches/3/cuda_9.1.85.3_linux
#然后运行 sudo chmod +x ...,再执行就可以了。
  • 不过,按照这种方法安装后,重新启动后挂起,可以参考本文后面的方法尝试解决。
    • 建议安装8.X版本,9.1安装后重启出现循环登录现象,进不去系统。
      • 使用run文件安装,deb安装会出现启动时系统挂起现象(好像不确定)。
    • 后来发现可能是安装图形驱动的问题,在选择是否安装驱动时,选择否,即可。

Ubuntu18.04:

https://developer.nvidia.com/compute/cuda/10.0/Prod/local_installers/cuda-repo-ubuntu1804-10-0-local-10.0.130-410.48_1.0-1_amd64

Install:

sudo dpkg -i cuda-repo-ubuntu1804-10-0-local-10.0.130-410.48_1.0-1_amd64.deb
sudo apt-key add /var/cuda-repo-<version>/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda

装完后还需要一些设置,才可以使用,提示如下:

===========
= Summary =
===========

Driver:   Not Selected
Toolkit:  Installed in /usr/local/cuda-9.1
Samples:  Installed in /home/openthings, but missing recommended libraries

Please make sure that
 -   PATH includes /usr/local/cuda-9.1/bin
 -   LD_LIBRARY_PATH includes /usr/local/cuda-9.1/lib64, or, add /usr/local/cuda-9.1/lib64 to /etc/ld.so.conf and run ldconfig as root

To uninstall the CUDA Toolkit, run the uninstall script in /usr/local/cuda-9.1/bin

Please see CUDA_Installation_Guide_Linux.pdf in /usr/local/cuda-9.1/doc/pdf for detailed information on setting up CUDA.

***WARNING: Incomplete installation! This installation did not install the CUDA Driver. A driver of version at least 384.00 is required for CUDA 9.1 functionality to work.
To install the driver using this installer, run the following command, replacing <CudaInstaller> with the name of this run file:
    sudo <CudaInstaller>.run -silent -driver

3、安装NVIDIA原厂驱动(不建议)

要安装更新的驱动,可以到NVidia官网(http://www.nvidia.cn/Download/index.aspx?lang=cn)下载。

安装时,要求关闭xserver,运行:

sudo service lightdm stop

ctl+alt+F1进入命令行模式。再按ctl+alt+F7可以返回图形界面。

运行完后,重启lightdm,再运行:

sudo service lightdm start

不过,由于测试不太充分,安装复杂不说,还会遇到重启后挂起的现象,导致无法登录。

可以启动时进入“高级-Recovery”模式,然后在命令行下重新设置。

运行:

 dpkg-reconfigure lightdm

系统修复措施,参考:

要是还不行的话,就只能重新安装系统了。

4、安装NVidia支持的Docker引擎

安装NVidia支持的Docker引擎,就可以在容器中使用GPU了。具体步骤如下:

# If you have nvidia-docker 1.0 installed: we need to remove it and all existing GPU containers
docker volume ls -q -f driver=nvidia-docker | xargs -r -I{} -n1 docker ps -q -a -f volume={} | xargs -r docker rm -f
sudo apt-get purge -y nvidia-docker

# Add the package repositories
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \
  sudo apt-key add -
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \
  sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update

# Install nvidia-docker2 and reload the Docker daemon configuration
sudo apt-get install -y nvidia-docker2
sudo pkill -SIGHUP dockerd

# Test nvidia-smi with the latest official CUDA image
docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi

注意,现在像上面运行 Docker 可以直接支持GPU了,不用再单独运行Docker-Nvidia命令了,大大增强了与各种容器编排系统的兼容性,Kubernetes目前也已经可以支持Docker容器运行GPU了。

目前版本依赖Docker 18.03版,如果已经安装了其它版本,可以指定安装的版本,如下:

sudo apt install docker-ce=18.03.1~ce-0~ubuntu

详细的参考:

© 著作权归作者所有

openthings

openthings

粉丝 335
博文 1176
码字总数 867375
作品 1
东城
架构师
私信 提问
加载中

评论(2)

openthings
openthings 博主
18.04 LTS install ppa failed.
openthings
openthings 博主
Ubuntu设置超宽屏(21:9, 2560*1080)时总是有问题,只能上1920*1080,字都是扁的。原来用的DVI接头转DP连接到Titan V,后来换了一根线(绿联,4K线,便宜的老线不行)就搞定了。根本不用做什么安装软件、设置啥的。
Ubuntu18.04上安装RTX 2080Ti显卡驱动

上了RTX 2080Ti显卡后,原来Ubuntu18.04内置的驱动和PPA安装的都不运作了,安装NVidia官网下载的驱动可以跑起来,但是需要费一些周折。 1、禁用系统默认显卡驱动 打开系统黑名单: 将下列代码...

openthings
2018/11/18
15.7K
0
Kubernetes集群升级NVidia GPU驱动版本

最近Kubernetes、Docker和NVidia GPU驱动都进行了较大的升级,因此考虑对Kubernetes集群升级NVidia GPU驱动版本。我这里使用Ubuntu 18.04LTS + NVidia GPU Driver 410.78 + Kubernetes 1.13....

openthings
2019/01/04
545
0
Kubernetes中调度GPU资源

Kubernetes中调度GPU资源 Kubernetes 包含一个体验性的功能,支持 AMD和NVIDIA GPUs 跨节点调度。对 NVIDIA GPUs 支持从 v1.6开始,然后经过几次不兼容的叠代修改,对AMD GPUs 的支持从 v1.9...

openthings
2019/01/04
1K
0
深度学习-在ubuntu16.04安装CUDA9.1-总结(问题完全解决方案)

深度学习大火,为了赶上AI的班车,许多研究生本科生们都在搞深度学习。然而深度学习环境搭建必不可少,这篇文章是我多次为实验室搭建环境所积累起来的经验总结,希望所有看到这篇文章的同志们...

oldpan
2018/05/14
0
0
ubuntu16.04在GTX1070环境下安装 cuda9.1

设备要求 系统:Ubuntu16.04 显卡:GTX 1070 驱动:nvidia系列,显卡驱动的版本必须大于等于cuda的sh文件名里面的版本号 驱动可从此处下载,我已经整理好了 检查安装驱动 nvidia-smi 显示如下...

ZJ&Y
2019/04/08
0
0

没有更多内容

加载失败,请刷新页面

加载更多

IT小白们进击前端工程师的学习路线:编辑器,基础进阶学习要点,框架

一、HTML、CSS基础、JavaScript语法基础。学完基础后,可以仿照电商网站(例如京东、小米)做首页的布局。 二、JavaScript语法进阶。包括:作用域和闭包、this和对象原型等。相信我,JS语法,...

梦想编程
5分钟前
19
0
ZhaoWei-2020-01-19

Dubbo Dubbo是一个分布式服务治理框架,提供高性能和透明化的RPC远程服务调用方案及 SOA架构治理方案。 远程通信 提供对多种基于长连接的NIO框架抽象封装,包括多种线程模型,序列化,以及 ...

SuSheePark
9分钟前
1
0
Python文件的常见标头格式是什么?

在有关Python编码准则的文档中,我遇到了以下Python源文件的头格式: #!/usr/bin/env python"""Foobar.py: Description of what foobar does."""__author__ = "Barack Obama"__cop......

javail
12分钟前
2
0
Linux 安装 jq

先下载jq安装包 https://stedolan.github.io/jq/download/将下载的安装包文件jq-linux64 拷贝到服务器下 wget -O jq https://github.com/stedolan/jq/releases/download/jq-1.6/jq-li......

乐易林谷
16分钟前
40
0
Elasticsearch深入:Refresh和Flush区别@

整体流程: 数据首先写入Buffer缓冲和Translog日志文件中。 当你写一条数据doc的时候,一方面写入到mem buffer缓冲中,一方面同时写入到translog日志文件中。 buffer满了或者每隔1秒(默认1秒...

HLee
20分钟前
4
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部