ubuntu18.04+CUDA9.0+cuDNN7.1.4+tensorflow1.9 环境搭建

1. 主机配置说明

在前几天,得知公司新采购了几台主机,所以我们组领导就向公司申请了一台回来,做数据分析。

服务器买的是惠普的主机,型号是:HP EliteDesk 800 G3。不算强劲,但用来做GPU的数据分析测试,也可以了。
具体参数:
CPU:i7-7700
内存: 32G
显卡: GTX 1070
硬盘: 256 ssd + 1T
自带 windows 10 64位 专业版系统

2. 更换系统

由于主机自带的是windows系统,但是我们想用 ubuntu 的系统,因此,只能先重装一下系统了。
具体的更换系统的过程就不写了,大家有需要的,可以参考一下这篇文章

要注意的是,不要关闭主板的 UEFI 引导,并且,你的 Ubuntu 系统引导盘,也就是U盘,需要用USB3.0的接口。因为,我测试的时候,用过普通 USB2.0 接口的,一直识别不了。同时,系统盘要制作成纯系统盘,里面出来系统软件之外,不要有其他文件。

3. 安装显卡驱动

新安装 ubuntu 18.04 的系统之后,先更新一下系统自带的源,我在自己使用的 CentOS 或者 Ubuntu 等linux 系列系统的时候,都习惯更换成阿里云的源,感觉速度和稳定都维护得比较好。

3.1 关闭系统默认的显卡驱动

如果你安装的是 ubuntu 带桌面图形界面的版本,那么它默认的显卡可能是nouveau,我们首先需要关闭它。具体方法:
打开禁用列表:

sudo vim  /etc/modprobe.d/blacklist.conf

在后面添加:

blacklist nouveau
options nouveau modeset=0

保存退出后,更新,重启系统:

sudo  update-initramfs -u

sudo reboot

重启后,你可能会发现屏幕没有了输出,甚至连登录界面也没有了。
先别慌,如果你使用 xshell 这类终端登录工具的话,这时你仍然能远程连接到系统的,前提是你已经在系统开启了 openssh-server,不过ubuntu 18 默认是没有开启openssh-server 的。
如果你没有用xshell 来连接,那么你可以按一下 ctrl + alt + F3 组合键,这时候,屏幕上又会切换到字符登录界面,熟悉的输入用户名,密码界面再次呈现。
这些都是因为,我们在上一步禁止了 nouveau 驱动,但是主机的独立显卡驱动还没有安装好。

3.2 安装nvidia 显卡驱动

在安装显卡驱动前,还需要再确认一下你系统自带的驱动有哪些:

[email protected]:~$ sudo ubuntu-drivers devices
[sudo] password for kkt:
== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
modalias : pci:v000010DEd00001B81sv0000103Csd00006899bc03sc00i00
vendor   : NVIDIA Corporation
model    : GP104 [GeForce GTX 1070]
driver   : nvidia-driver-396 - third-party free
driver   : nvidia-driver-390 - third-party free
driver   : nvidia-driver-410 - third-party free
driver   : nvidia-driver-415 - third-party free recommended
driver   : xserver-xorg-video-nouveau - distro free builtin

可以,看出nvidia 支持的驱动版本有396,390,410,415 几个类型。不过这是我在添加显卡 ppa 源之后,才显示这么多个的,本来只有390,396两个版本。
怎么添加显卡 ppa 源:

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update

在添加 ppa 源的时候,可能会因为网络的原因,更新失败。我们需要留意提示信息,以为添加失败之后,会导致某些版本根本不能安装。
选择你希望安装的 nvidia 版本,我推荐安装 nvidia-driver-396 的版本,不求它最新,因为最新的版本,兼容性反而可能会差,甚至用不了。
安装nvidia 驱动:
重点: 先删除旧的 nvidia 驱动

sudo apt-get purge nvidia-*

sudo apt   install nvidia-driver-396

安装完成之后,重启主机 : sudo reboot
检查 nvidia 显卡状况:

sudo nvidia-smi

如果你没有检测到nvidia显卡的状态,可能需要先挂载:

sudo  nvidia  modprobe nvidia

正常来说,如果你的主机有独立显卡,在安装完nvidia显卡驱动,重启就能在屏幕输出你熟悉的图形登录界面。

4. 安装 CUDA 9.0

首先,cuda 9.0 编译安装只支持gcc、g++ 6.0 及以下的版本,所以,如果系统已经默认安装了gcc 7.0 以上版本的,就需要将级了。

sudo apt-get install gcc-4.8

sudo apt-get install g++-4.8

切换到 /usr/bin 目录,对gcc7.0 进行降级,其实就是重新创建软连接:

ls  -l   gcc*
sudo mv  gcc   gcc.bak
sudo ln -s  gcc-4.8  gcc

ls -l   g++*
sudo  mv  g++ g++.bak
sudo ln  -s  g++-4.8  g++

重新查看g++、gcc 的版本:

g++  -v
gcc   -v

确认gcc、g++ 的版本为4.8 就可以了。

下载CUDA 9.0

说明,现在先不要使用 cuda 9.1 或者 cuda 10,因为后面 tensorflow 对这些版本还没有支持。我一开始安装的也是cuda 9.1 以为版本越新越好。
cuda 各个版本的归档目录在这里,选择9.0 的版本:

注意,这里选择 ubuntu 16.04 的系统版本,对18.04 也适用。
cuda 9.0 共5个文件,包括4个patch都需要下载。下载完成之后,上传到服务器,进行安装,cuda安装的过程中,会提示要安装nvidia driver的,不要安装,因为我们之前已经安装过了。其他的选项可以随意:

sudo sh cuda_9.0.176_384.81_linux-run
sudo sh cuda_9.0.176.1_linux-run
sudo sh cuda_9.0.176.2_linux-run
sudo sh cuda_9.0.176.3_linux-run
sudo sh cuda_9.0.176.4_linux-run

同样,下载 cuDNN 进行安装。cuDNN 的版本选择 7.1.4,选择7.0的大多数情况会没有问题,但是当使用 tensorflow 进行卷积运算的时候,会提示初始化失败,原因是 tensorflow 1.9 里编译的支持的版本是 7.1.4 及以上。
下载 cuDNN 请在这里 ,注意,下载需要提供注册账号,自己搞一个邮箱注册一下。

下载完成之后,上传到服务器,开始安装:

其实是先解压,然后将文件复制到cuda-9.0 的目录里。
sudo  tar  xvzf  cudnn-9.0-linux-x64-v7.1.tgz
解压之后,默认的目录名也叫 cuda.
然后,复制cuDNN的内容:
sudo   cp cuda/include/cudnn.h    /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn*    /usr/local/cuda/lib64
最后,修改权限:
sudo chmod a+r /usr/local/cuda/include/cudnn.h   /usr/local/cuda/lib64/libcudnn*

至此,cuda 和 cudnn已经安装完毕。
但是,还需要修改一下环境变量:

修改 sudo  vim  ~/.bashrc,添加以下内容:

export CUDA_HOME=/usr/local/cuda
export LD_LIBRARY_PATH=${CUDA_HOME}/lib64
export  PATH=${CUDA_HOME}/bin:${PATH}

修改 sudo  vim  /etc/profile ,添加以下内容:
export PATH=/usr/local/cuda/bin:$PATH

继续修改:

sudo vim   /etc/ld.so.conf.d/cuda.conf

/usr/local/cuda/lib64

修改后,加载配置,但可能会提示:(/usr/local/cuda/lib64/libcudnn.so.7 不是符号链接?)

sudo   ldconfig
sudo  ln -sf /usr/local/cuda/lib64/libcudnn.so.7.1.4?   /usr/local/cuda/lib64/libcudnn.so.7
sudo ldconfig

最后,可以安装tensorflow 了

5. 安装 tensorflow

利用pip 的方式来安装:

sudo  pip3  install  tensorflow-gpu==1.9.0

没有pip3 的,自己安装一下:

sudo apt install  python3-pip

6. 总结

tensorflow 的版本兼容比较严格,这一点值得注意。

原文地址:http://blog.51cto.com/hellocjq/2320966

时间: 2024-08-30 12:09:43

ubuntu18.04+CUDA9.0+cuDNN7.1.4+tensorflow1.9 环境搭建的相关文章

Ubuntu18.04 + CUDA9.0 + cuDNN7.3 + Tensorflow-gpu-1.12 + Jupyter Notebook深度学习环境配置

目录 一.Ubuntu18.04 LTS系统的安装 1. 安装文件下载 2. 制作U盘安装镜像文件 3. 开始安装 二.设置软件源的国内镜像 1. 设置方法 2.关于ubuntu镜像的小知识 三.Nvidia显卡驱动的安装 1. 首先查看显卡型号和推荐的显卡驱动 2. 安装nvidia-390版本驱动 3. 重启系统,可以查看安装是否成功 四.CUDA9.0的安装 1. CUDA版本选择 2. 安装CUDA9.0 3. 设置环境变量 五.cuDNN7.3的安装 六.Tensorflow-1.12

ubuntu18.04+cuda9.0+cudnn7.1.4+caffe-ssd+anaconda2安装

几乎是小白一枚,折腾多天才搞定,参考了很多博客和社区问答,把安装经验记下来. 1.检测显卡,安装驱动 1 ~$ ubuntu-drivers devices 2 == /sys/devices/pci0000:00/0000:00:1c.4/0000:09:00.0 == 3 modalias : pci:v000010DEd00001292sv00001028sd00000616bc03sc02i00 4 vendor : NVIDIA Corporation 5 model : GK208M

YOLO 训练环境搭建(Ubuntu18.04+Cuda9.0+Cudnn7.1)

1.先查看是否安装有以下组件,若有先考虑彻底删除再安装(安装严格按照下面顺序进行) 查看nvidia 版本 nvidia-smi 查看cuda 版本 cat /usr/local/cuda/version.txt 查看cudnn 版本 cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2 2.nvidia 驱动,cuda,cudnn对应关系  nvidia与cuda要求的版本对应关系: https://docs.nvidia.co

Ubuntu18.04 + cuda9.0+cudnn7.0

1 cannot find Toolkit in /usr/local/cuda-8.0 2017年05月27日 17:37:33 阅读数:2754 对于新版本ubuntukylin17.04安装CUDA时出现 cannot find Toolkit in /usr/local/cuda-8.0 问题 尝试了各种方法,均不妥当...... 参考:https://devtalk.nvidia.com/default/topic/992023/install-cuda-on-debian/ 使用ap

ubuntu tensorflow install(Ubuntu16.04+CUDA9.0+cuDNN7.5+Python3.6+TensorFlow1.5)

在网上找了很多案例,踩了许多坑,感觉比较全面的是下面介绍的 http://www.cnblogs.com/xuliangxing/p/7575586.html 先说说我的步骤: 首先安装了Anacoda,因为是科学运算环境,所以先安装了最新版,所以对应的Python 3.6 安装显卡驱动:GTX950M 安装了最新的 390驱动,担心不兼容,所以都用最新的 安装cuda,这个坑最后才发现,因为安装最新的9.1版本,最后tensorflow只找9.0的文件.所以,这个地方一定要选其他release

基于QT 5.7.0 for Android 的 Windows 开发环境搭建

基于QT 5.7.0 for Android 的 Windows 开发环境搭建 本文属于转载原文地址https://my.oschina.net/armsky/blog/740645 一.下载软件1.jdk:jdk-8u102-windows-i586.exehttp://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.htmlhttp://download.oracle.com/otn-pub/ja

TensorFlow安装(Ubuntu18.04+Anaconda3+CUDA9.0+cuDNN7.1+TensorFlow1.8.0+Pycharm)

p { margin-bottom: 0.1in; line-height: 115% } a:link { } 1.安装pip (1)安装 sudo apt-get install python3-pip python3-dev (2)查看pip是否安装成功 pip3 -V (3)切换国内源 Linux下,修改 ~/.pip/pip.conf (没有就创建一个), 修改 index-url至tuna,内容如下: [global] index-url = https://pypi.tuna.ts

深度学习(TensorFlow)环境搭建:(三)Ubuntu16.04+CUDA8.0+cuDNN7+Anaconda4.4+Python3.6+TensorFlow1.3

紧接着上一篇的文章<深度学习(TensorFlow)环境搭建:(二)Ubuntu16.04+1080Ti显卡驱动>,这篇文章,主要讲解如何安装CUDA+CUDNN,不过前提是我们是已经把NVIDIA显卡驱动安装好了 一.安装CUDA CUDA(Compute Unified Device Architecture),是英伟达公司推出的一种基于新的并行编程模型和指令集架构的通用计算架构,它能利用英伟达GPU的并行计算引擎,比CPU更高效的解决许多复杂计算任务,想使用GPU就必须要使用CUDA.

anconda1.8+cuda9.0+cudnn7.0.5+tensorflow1.7(win10)安装

1.下载安装cuda9.0 https://developer.nvidia.com/cuda-90-download-archive 2.下载cudnn7.0.5,下载cuda9.0的对应版本 https://developer.nvidia.com/rdp/cudnn-download 操作: 1.将cudnn文件夹下的文件拷贝到cuda9.0对应的文件夹下 2.打开cmd,用命令nvcc -V检验cuda是否安装成功,成功界面如下: 说明:之前用的是cudnn7.1.2,一直出各种问题,最