目录
- gpu之环境配置
- N卡驱动安装
- cuda安装
- cudnn安装
- 配置环境变量
- 测试cuda和cudnn
- 查看显卡占用情况
- tensorflow
- coffe
- 参考
gpu之环境配置
注:首先安装Nvidia显卡驱动,然后安装cuda和相应的cudnn, 最后配置环境。显卡驱动和cuda分别安装。
注: 有教程中说要把python
库的链接从默认的2.7
改到3.x
, 因为系统很多配置是与python版本挂钩的,所以尽量不要改动python版本,否则很多软件会用不了。
N卡驱动安装
查看n卡驱动和cuda版本的对应关系:NVIDIA CUDA Toolkit Release Notes
注: 驱动安装后要重启电脑
sudo reboot
- 使用Ubuntu系统的集成驱动管理和安装
现在新版的Ubuntu系统已经集成了驱动管理和安装工具,通过System Settings->SoftWare & Updates->Additional Drivers 切换安装,如果在备选的列表里没有找到NVIDIA的驱动,则通过如下解决:
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
- 使用apt-get install安装
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-410 nvidia-settings nvidia-prime
- 官方驱动编译安装(目前不太推荐)
- 验证安装是否成功
查看驱动版本和显卡属性:
nvidia-smi
和
nvidia-settings
- 删除nvidia驱动
sudo apt-get --purge remove nvidia-*
sudo rm -rf /usr/local/cuda-XX/
cuda安装
CUDA Toolkit
推荐安装cuda9.0或cuda10.0
选择Linux -> x86_64 -> Ubuntu -> 16.04 -> runfile(local) 或者deb(local)
sudo dpkg -i cuda-repo-ubuntu1604-xx_amd64.deb
sudo apt-key add /var/cuda-repo-<tab-complete>/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda
注: 如果有patch(补丁)则下载相应的安装。
cudnn安装
NVIDIA cuDNN is a GPU-accelerated library of primitives for deep neural networks.
下载与cuda对应的deb包安装。
sudo dpkg -i libcudXX.deb
配置环境变量
打开个人配置文件:
sudo gedit ~/.zshrc
在文件尾部输入以下命令:
export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH
或者
export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda
更新变量环境
source ~/.zshrc
测试cuda和cudnn
- 使用cuda里面的samples来测试是否安装成功
cd /usr/local/cuda-10.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
和
cd usr/local/cuda-10.0/samples/1_Utilities/bandwidthTest
sudo make
./bandwidthYest
- 如果返回结果是这样的:
deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 10.0,
CUDA Runtime Version = 10.0, NumDevs = 1
Result = PASS
那你简直是很lucky!
- 如果返回的结果是:
CUDADeviceQuery(RuntimeAPI)version(CUDARTstaticlinking)
cudaGetDeviceCount returned 35
-> CUDA driver version is insufficient for CUDA runtime version
Result = FAIL
有教程提到将Ubuntu中intel的集成显卡切换到nvidia显卡,但我试过没用啊!在终端输入:
nvidia-settings
在左侧栏找到PRIME Profiles
, 进入切换即可。如果没有这一栏,则:
prime-select nvidia
- 如果返回的结果是这样的:
cudaGetDeviceCount returned 30
-> unknown error
[deviceQuery] test results...
FAILED
目测多半是废了(捂脸.jpg)。
- 删除cuda和cudnn
sudo apt-get --purge remove cuda-*
sudo rm -rf
查看显卡占用情况
在终端中输入
watch -n 10 nvidia-smi
注:每隔10秒刷新一次终端
- 结束进程
sudo kill -9 PID
tensorflow
未完待续
coffe
未完待续
参考
- Install CUDA 10.0, cuDNN 7.3 and build TensorFlow (GPU) from source on Ubuntu 18.04
- Ubuntu 16.04配置TensorFlow-GPU 1.6.0
- Ubuntu下实时查看Nvidia显卡显存占用情况
原文地址:https://www.cnblogs.com/ChrisCoder/p/10348087.html