centos7 安装 NVIDIA Docker

安装环境:

1、centos7.3

2、NVIDIA Corporation GP106 [GeForce GTX 1060 6GB]

安装nvidia-docker

a、安装docker 可参考centos7 安装docker

b:

# Install nvidia-docker and nvidia-docker-plugin
wget -P /tmp https://github.com/NVIDIA/nvidia-docker/releases/download/v1.0.1/nvidia-docker-1.0.1-1.x86_64.rpm
sudo rpm -i /tmp/nvidia-docker*.rpm && rm /tmp/nvidia-docker*.rpm
sudo systemctl start nvidia-docker

# Test nvidia-smi
nvidia-docker run --rm nvidia/cuda nvidia-smi

如果出现异常:

[[email protected] ~]# nvidia-docker run --rm nvidia/cuda nvidia-smi
/usr/bin/docker-current: Error response from daemon: create nvidia_driver_384.69: create nvidia_driver_384.69: Error looking up volume plugin nvidia-docker: plugin not found.
See ‘/usr/bin/docker-current run --help‘.

则检查nvidia-docker是否启动:

[[email protected] ~]# systemctl status nvidia-docker
● nvidia-docker.service - NVIDIA Docker plugin
   Loaded: loaded (/usr/lib/systemd/system/nvidia-docker.service; disabled; vendor preset: disabled)
   Active: inactive (dead)
     Docs: https://github.com/NVIDIA/nvidia-docker/wiki
[[email protected] ~]# systemctl start nvidia-docker
[[email protected] ~]# systemctl status nvidia-docker
● nvidia-docker.service - NVIDIA Docker plugin
   Loaded: loaded (/usr/lib/systemd/system/nvidia-docker.service; disabled; vendor preset: disabled)
   Active: active (running) since Wed 2017-08-30 03:18:32 CST; 5s ago
     Docs: https://github.com/NVIDIA/nvidia-docker/wiki
  Process: 11135 ExecStartPost=/bin/sh -c /bin/echo unix://$SOCK_DIR/nvidia-docker.sock > $SPEC_FILE (code=exited, status=0/SUCCESS)
  Process: 11131 ExecStartPost=/bin/sh -c /bin/mkdir -p $( dirname $SPEC_FILE ) (code=exited, status=0/SUCCESS)
 Main PID: 11130 (nvidia-docker-p)
   CGroup: /system.slice/nvidia-docker.service
           └─11130 /usr/bin/nvidia-docker-plugin -s /var/lib/nvidia-docker

Aug 30 03:18:32 localhost.localdomain systemd[1]: Starting NVIDIA Docker plugin...
Aug 30 03:18:32 localhost.localdomain systemd[1]: Started NVIDIA Docker plugin.
Aug 30 03:18:32 localhost.localdomain nvidia-docker-plugin[11130]: /usr/bin/nvidia-docker-plugin | 2017/08/30 03:18:32 Loading NV...mory
Aug 30 03:18:32 localhost.localdomain nvidia-docker-plugin[11130]: /usr/bin/nvidia-docker-plugin | 2017/08/30 03:18:32 Loading NV...rary
Aug 30 03:18:33 localhost.localdomain nvidia-docker-plugin[11130]: /usr/bin/nvidia-docker-plugin | 2017/08/30 03:18:33 Discoverin...ices
Aug 30 03:18:33 localhost.localdomain nvidia-docker-plugin[11130]: /usr/bin/nvidia-docker-plugin | 2017/08/30 03:18:33 Provisioni...umes
Aug 30 03:18:33 localhost.localdomain nvidia-docker-plugin[11130]: /usr/bin/nvidia-docker-plugin | 2017/08/30 03:18:33 Serving pl...cker
Aug 30 03:18:33 localhost.localdomain nvidia-docker-plugin[11130]: /usr/bin/nvidia-docker-plugin | 2017/08/30 03:18:33 Serving re...3476
Hint: Some lines were ellipsized, use -l to show in full.
[[email protected] ~]# nvidia-docker run --rm nvidia/cuda nvidia-smi
Tue Aug 29 19:18:46 2017
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 384.69                 Driver Version: 384.69                    |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 106...  Off  | 00000000:01:00.0 Off |                  N/A |
| 43%   39C    P0    22W / 120W |     10MiB /  6072MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID  Type  Process name                               Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

如果出现以下情况:

[[email protected] ~]# nvidia-docker run --rm nvidia/cuda nvidia-smi
NVIDIA-SMI couldn‘t find libnvidia-ml.so library in your system. Please make sure that the NVIDIA Display Driver is properly installed and present in your system.
Please also try adding directory that contains libnvidia-ml.so to your system PATH.key

可以尝试一下加参数--privileged=true ,如果没问题,则需要修改selinux配置,编辑/etc/selinux/config:

SELINUX=disabled
SELINUXTYPE=targeted

或者尝试selinux模式为permissive模式 setenforce 0

重启机器,重启服务器即可。

可参考:

https://github.com/NVIDIA/nvidia-docker/issues/407

https://github.com/NVIDIA/nvidia-docker

时间: 2024-10-11 22:42:53

centos7 安装 NVIDIA Docker的相关文章

Centos7安装nvidia显卡驱动

Centos 7安装Nvidia显卡驱动没有Fedora这种偏图形界面使用的Linux发行版容易.而且在网上搜到的方法都比较复杂,需要进行一定的修改设置.这里提供一种比较简单的方法,适合一些小白或者不想太折腾的使用者. 首先需要添加一个第三方的源ELRepo.这个源支持RED HAT系的Linux系统,主要是提供一些硬件的驱动程序.这个源的主页如下: http://elrepo.org/tiki/tiki-index.php 添加源分两步: 1.导入公共密钥 rpm --import https

CentOS7安装使用Docker

安装 Docker 官方为了简化安装流程,提供了一套安装脚本,CentOS 系统上可以使用这套脚本安装: curl -sSL https://get.docker.com/ | sh 执行这个命令后,脚本就会自动的将一切准备工作做好,并且把 Docker 安装在系统中. 不过,由于伟大的墙的原因,在国内使用这个脚本可能会出现某些下载出现错误的情况.国内的一些云服务商提供了这个脚本的修改版本,使其使用国内的 Docker 软件源镜像安装,这样就避免了墙的干扰. 阿里云安装脚本 curl -sSL

centos7 安装harbor docker镜像库

安装docker,git yum install docker  docker-logrotate git -y 安装docker-compose yum install python-pip -y pip install --upgrade pip pip install docker-compose pip install --upgrade backports.ssl_match_hostname 下载harbor git clone https://github.com/vmware/h

centos7安装nvidia驱动

添加 ELRepo 源: Import the public key: rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org (external link) To install ELRepo for RHEL-7, SL-7 or CentOS-7: yum install https://www.elrepo.org/elrepo-release-7.0-3.el7.elrepo.noarch.rpm (external lin

centos7 安装 卸载docker

Install with yum sudo tee /etc/yum.repos.d/docker.repo <<-'EOF' [dockerrepo] name=Docker Repository baseurl=https://yum.dockerproject.org/repo/main/centos/7/ enabled=1 gpgcheck=1 gpgkey=https://yum.dockerproject.org/gpg EOF Install the Docker packag

CentOS7 Nvidia Docker环境

最近在搞tensorflow的一些东西,话说这东西是真的皮,搞不懂.但是环境还是磕磕碰碰的搭起来了 其实本来是没想到用docker的,但是就一台配置较好的服务器,还要运行公司的其他环境,vmware esxi用起来太费劲,还是算了. 环境: 系统:CentOS7 7.4 1708 显卡:Nvidia 1080Ti 下载所有需要的东东 1.docker-ce yum repo : https://download.docker.com/linux/centos/docker-ce.repo 2.n

centos7安装docker

1.查看linux发行版,内核 [[email protected]~]# cat /etc/redhat-release #查看版本号 CentOS Linux release 7.1.1503 (Core) [[email protected] ~]# uname -r #查看Linux内核 c3.10.0-229.el7.x86_64 2.替换阿里云yum源 1 wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.

docker探索-CentOS7中配置Docker的yum源并升级安装docker1.13(十)

此处使用的是CentOS7,内核版本为 [[email protected] ~]# uname -r 3.10.0-327.el7.x86_64 该版本下,配置了yum的源为阿里的镜像源,具体的配置方法可以参见阿里镜像源配置方法 为了方便的安装升级Docker,同时按照Docker官方文档中的方式,配置Docker的yum源,具体参见CentOS docker yum 源配置方法 配置好yum源之后,可以通过yum的list命令,获取可以安装的docker版本 [[email protecte

CENTOS7安装DOCKER步骤以及安装阿里镜像加速后无法正常启动服务的问题2018年1月

本文时间2017年12月7日,比较新,大家可以直接参考.有问题直接评论 我根据菜鸟教程通过yum install docker安装了docker,由于测试发现奇慢无比,所以就安装了阿里云的加速,随后也尝试了DaoCloud的镜像. 配置成功后一直报错 我尝试了各种原因,发现都不靠谱.因为阿里这样的公司是不会漏掉什么关键配置的.那么原因在哪里呢?就是安装过程不是标准做法,漏掉了某些配置.我才是可能配置数据仓库的问题.所以现在我更分一份最新的安装手册.大家可以重现安装一下Docker问题就解决了.