文档章节

Ubuntu16.04下安装nvidia-docker2

o
 osc_fmg49rzg
发布于 2019/03/20 13:29
字数 641
阅读 9
收藏 0

精选30+云产品,助力企业轻松上云!>>>

若docker-ce、nvidia、CUDA等都安装完成之后,开启docker服务时,能够正常运行,并有预测结果,那表示服务开启没问题;若都安装成功之后,用docker命令开启服务时,一直报错,可能表示你没有安装nvidia-docker2:
报错信息:
tf-serving@tfserving-KVM:~/model/yolo$ docker: Error response from daemon: OCI runtime create failed: unable to retrieve OCI runtime error (open /run/containerd/io.containerd.runtime.v1.linux/moby/f40efd9bd62fc00e53e1d48ea0cbbf8e2c76efdac28238239c6a0c49f52aaebc/log.json: no such file or directory): fork/exec /usr/bin/nvidia-container-runtime: no such file or directory: : unknown.
$ systemctl status docker.service

结果:
docker.service - Docker Application Container Engine
   Loaded: loaded (/lib/systemd/system/docker.service; enabled; vendor preset: enabled)
  Drop-In: /etc/systemd/system/docker.service.d
           └─override.conf
   Active: failed (Result: start-limit-hit) since 四 2019-06-20 11:43:26 CST; 8s ago
     Docs: https://docs.docker.com
  Process: 8024 ExecStart=/usr/bin/dockerd --host=fd:// --add-runtime=nvidia=/usr/bin/nvidia-container-runtime (code=exited, status=1/FAILURE)
 Main PID: 8024 (code=exited, status=1/FAILURE)

6月 20 11:43:26 tfserving-KVM systemd[1]: Failed to start Docker Application Container Engine.
6月 20 11:43:26 tfserving-KVM systemd[1]: docker.service: Unit entered failed state.
6月 20 11:43:26 tfserving-KVM systemd[1]: docker.service: Failed with result 'exit-code'.
6月 20 11:43:26 tfserving-KVM systemd[1]: docker.service: Service hold-off time over, scheduling restart.
6月 20 11:43:26 tfserving-KVM systemd[1]: Stopped Docker Application Container Engine.
6月 20 11:43:26 tfserving-KVM systemd[1]: docker.service: Start request repeated too quickly.
6月 20 11:43:26 tfserving-KVM systemd[1]: Failed to start Docker Application Container Engine.
6月 20 11:43:26 tfserving-KVM systemd[1]: docker.service: Unit entered failed state.
6月 20 11:43:26 tfserving-KVM systemd[1]: docker.service: Failed with result 'start-limit-hit'.

出现类似这样的信息,错误,解决办法,可尝试:

(1)重新安装docker-ce及tensorflow_model_server;

(2)安装nvidia-docker2,步骤如下:

0 If you have nvidia-docker 1.0 installed: we need to remove it and all existing GPU containers
docker volume ls -q -f driver=nvidia-docker | xargs -r -I{} -n1 docker ps -q -a -f volume={} | xargs -r docker rm - f
sudo apt-get purge -y nvidia-docker
 
1. 创建用户组
sudo groupadd docker
 
2.添加用户进入docker组,以便该用户可以使用docker
sudo gpasswd -a ${USER} docker
 
3.重启服务
sudo service docker restart
 
4.修改docker仓库和存放目录
sudo vim /etc/docker/daemon.json
 
5.修改如下,其中https://cwoel6s9.mirror.aliyuncs.com 为从阿里服务器申请的镜像地址,/data/docker     为存放目录
{
    "registry-mirrors": [
        "https://cwoel6s9.mirror.aliyuncs.com"
    ],
    "graph":"/data/docker",
    "storage-driver": "overlay",
    "runtimes": {
        "nvidia": {
            "path": "nvidia-container-runtime",
            "runtimeArgs": []
        }
    }
 
6.重启docker,并使用docker info查看修改信息
systemctl daemon-reload
systemctl restart docker
docker info
 
7.nvidia-docker 安装,添加源
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \
  sudo apt-key add -
 
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \
  sudo tee /etc/apt/sources.list.d/nvidia-docker.list
 
sudo apt-get update
 
8.安装nvidia-docker2软件包并重新加载Docker守护程序配置
sudo apt-get install nvidia-docker2
sudo pkill -SIGHUP dockerd
 
安装完成后,当需要使用gpu时,使用nvidia-docker代替docker!

# 注意:执行这一步,如果没有安装nvidia驱动,会报错:
# docker:ERROR response from Daemon....
# 安装nvida驱动就可以了

 

o
粉丝 0
博文 500
码字总数 0
作品 0
私信 提问
加载中
请先登录后再评论。
ubuntu18.04在线安装docker、nvidia-docker2与docker-compos

说明 由于项目测试需要,须安装如下版本的docker组建: 部署 Docker 主要步骤如下: 安装 nvidia-docker(有nvidia-docker2才支持cuda10) 主要步骤如下: 安装 docker-compose nvidia-dock...

品鉴初心
03/25
0
0
ubuntu1804 安装Nvidia驱动-nvidia-docker

##操作 看显卡 驱动下载https://www.nvidia.com/Download/index.aspx?lang=en-ushttp://www.nvidia.cn/Download/driverResults.aspx/156091/cn ###删除原有驱动 ###禁用nouveau驱动 看是否成......

osc_arj2xsvk
2019/12/24
21
0
[笔记] Ubuntu 18.04安装Docker CE及NVIDIA Container Toolkit流程

之前写的[笔记] Ubuntu 18.04安装Docker CE及nvidia-docker2流程已经out了,以这篇为准。 Docker的好处之一,就是在Container里面可以随意瞎搞,不用担心弄崩Host的环境。为了在docker中支持...

osc_bg494qeb
2019/07/23
18
0
Ubuntu16.04+nvidia docker

一、安装过程: https://blog.csdn.net/heiheiya/article/details/102834222 1、先卸载干净以前的nvidia-docker sudo docker volume ls -q -f driver=nvidia-docker | xargs -r -I{} -n1 do......

osc_1jvmu893
2019/12/30
3
0
Ubuntu16.04安装Docker、nvidia-docker

Ubuntu16.04安装Docker、nvidia-docker Docker安装 1.更换国内软件源,推荐中国科技大学的源,稳定速度快(可选) 2.安装需要的包 3.添加 GPG 密钥,并添加 Docker-ce 软件源,这里还是以中国...

osc_uctp74i1
2019/10/14
21
0

没有更多内容

加载失败,请刷新页面

加载更多

是否有可能从另一个git存储库中挑选一个提交? - Is it possible to cherry-pick a commit from another git repository?

问题: I'm working with a git repository that needs a commit from another git repository that knows nothing of the first. 我正在使用一个git存储库,需要从另一个不知道第一个存储库......

技术盛宴
昨天
26
0
【LeetCode】53 盛最多水的容器

题目 解题思路 双指针法: https://leetcode-cn.com/problems/container-with-most-water/solution/sheng-zui-duo-shui-de-rong-qi-by-leetcode-solution/ 代码 public class Solution { ......

JaneRoad
昨天
16
0
阿里云OSS配置CDN加速

首先购买CDN流量包 然后添加域名 添加好后 然后将域名OSS.xxxx.com 解析到 生成的CDN域名上 这样就完成了

可达鸭眉头一皱
昨天
16
0
js 整数与小数正则替换片段

说明 /(\d+)/g 整数 /(\d+\.\d+)rem/g 小数 /(\d+\.\d+|\d+)rem/g 其中 | 或 条件 例子 全局查找带 rem 单位的,替换成 px 单位 let text = text.replace(/(\d+\.\d+|\d+)rem/g, function(s......

DrChenXX
昨天
17
0
ubuntu下minicorba例子

一、开发环境安装 sudo apt install omniorb omniorb-idl omniidl libomniorb4-dev libomniorb4-2 omniorb-nameserver libomnithread4 libomnithread4-dev 二、源文件: Hi.idl module ......

wangxuwei
昨天
18
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部