nvidia gpu的环境配置

目录

  • gpu之环境配置

    • N卡驱动安装
    • cuda安装
    • cudnn安装
    • 配置环境变量
    • 测试cuda和cudnn
    • 查看显卡占用情况
    • tensorflow
    • coffe
    • 参考

gpu之环境配置

注:首先安装Nvidia显卡驱动,然后安装cuda和相应的cudnn, 最后配置环境。显卡驱动和cuda分别安装。

注: 有教程中说要把python库的链接从默认的2.7改到3.x, 因为系统很多配置是与python版本挂钩的,所以尽量不要改动python版本,否则很多软件会用不了。

N卡驱动安装

查看n卡驱动和cuda版本的对应关系:NVIDIA CUDA Toolkit Release Notes

注: 驱动安装后要重启电脑

sudo reboot
  • 使用Ubuntu系统的集成驱动管理和安装

现在新版的Ubuntu系统已经集成了驱动管理和安装工具,通过System Settings->SoftWare & Updates->Additional Drivers 切换安装,如果在备选的列表里没有找到NVIDIA的驱动,则通过如下解决:

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
  • 使用apt-get install安装
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-410 nvidia-settings nvidia-prime
  • 官方驱动编译安装(目前不太推荐)
  • 验证安装是否成功

查看驱动版本和显卡属性:

nvidia-smi

nvidia-settings
  • 删除nvidia驱动
sudo apt-get --purge remove nvidia-*
sudo rm -rf /usr/local/cuda-XX/

cuda安装

CUDA Toolkit

推荐安装cuda9.0或cuda10.0

选择Linux -> x86_64 -> Ubuntu -> 16.04 -> runfile(local) 或者deb(local)

sudo dpkg -i cuda-repo-ubuntu1604-xx_amd64.deb
sudo apt-key add /var/cuda-repo-<tab-complete>/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda

注: 如果有patch(补丁)则下载相应的安装。

cudnn安装

NVIDIA cuDNN is a GPU-accelerated library of primitives for deep neural networks.

下载与cuda对应的deb包安装。

sudo dpkg -i libcudXX.deb

配置环境变量

打开个人配置文件:

sudo gedit ~/.zshrc

在文件尾部输入以下命令:

export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH

或者

export PATH=/usr/local/cuda-9.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda

更新变量环境

source ~/.zshrc

测试cuda和cudnn

  • 使用cuda里面的samples来测试是否安装成功
cd /usr/local/cuda-10.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

cd usr/local/cuda-10.0/samples/1_Utilities/bandwidthTest
sudo make
./bandwidthYest
  • 如果返回结果是这样的:
deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 10.0,
CUDA Runtime Version = 10.0, NumDevs = 1
Result = PASS

那你简直是很lucky!

  • 如果返回的结果是:
CUDADeviceQuery(RuntimeAPI)version(CUDARTstaticlinking)
cudaGetDeviceCount returned 35
-> CUDA driver version is insufficient for CUDA runtime version
Result = FAIL

有教程提到将Ubuntu中intel的集成显卡切换到nvidia显卡,但我试过没用啊!在终端输入:

nvidia-settings

在左侧栏找到PRIME Profiles, 进入切换即可。如果没有这一栏,则:

prime-select nvidia
  • 如果返回的结果是这样的:
cudaGetDeviceCount returned 30
-> unknown error
[deviceQuery] test results...
FAILED

目测多半是废了(捂脸.jpg)。

  • 删除cuda和cudnn
sudo apt-get --purge remove cuda-*
sudo rm -rf 

查看显卡占用情况

在终端中输入

watch -n 10 nvidia-smi

注:每隔10秒刷新一次终端

  • 结束进程
sudo kill -9  PID

tensorflow

未完待续

coffe

未完待续

参考

原文地址:https://www.cnblogs.com/ChrisCoder/p/10348087.html

时间: 2024-08-29 00:17:42

nvidia gpu的环境配置的相关文章

OpenCV GPU CUDA OpenCL 配置

首先,正确安装OpenCV,并且通过测试. 我理解GPU的环境配置由3个主要步骤构成. 1. 生成关联文件,即makefile或工程文件 2. 编译生成与使用硬件相关的库文件,包括动态.静态库文件. 3. 将生成的库文件加入到程序中,加入过程类似于OpenCV库的添加过程. 详细操作参见: http://wenku.baidu.com/link?url=GGDJLZFwhj26F50GqW-q1ZcWek-QN2kAgVJ5SHrQcmte-nx9-GyIUKxGwIvtzJ_WoBddvasI

深度学习 GPU环境 Ubuntu 16.04 + Nvidia GTX 1080 + Python 3.6 + CUDA 9.0 + cuDNN 7.1 + TensorFlow 1.6 环境配置

本节详细说明一下深度学习环境配置,Ubuntu 16.04 + Nvidia GTX 1080 + Python 3.6 + CUDA 9.0 + cuDNN 7.1 + TensorFlow 1.6. Python 3.6 首先安装 Python 3.6,这里使用 Anaconda 3 来安装,下载地址:https://www.anaconda.com/download/#linux,点击 Download 按钮下载即可,这里下载的是 Anaconda 3-5.1 版本,如果下载速度过慢可以选

(转)深度学习主机环境配置: Ubuntu16.04+Nvidia GTX 1080+CUDA8.0

深度学习主机环境配置: Ubuntu16.04+Nvidia GTX 1080+CUDA8.0 发表于2016年07月15号由52nlp 接上文<深度学习主机攒机小记>,这台GTX1080主机准备好之后,就是配置深度学习环境了,这里选择了比较熟悉Ubuntu系统,不过是最新的16.04版本,另外在Nvidia GTX1080的基础上安装相关GPU驱动,外加CUDA8.0,因为都比较新,所以踩了很多坑. 1. 安装Ubuntu16.04 不考虑双系统,直接安装 Ubuntu16.04,从ubun

深度学习服务器环境配置: Ubuntu17.04+Nvidia GTX 1080+CUDA 9.0+cuDNN 7.0+TensorFlow 1.3

本文来源地址:http://www.52nlp.cn/tag/cuda-9-0 一年前,我配置了一套"深度学习服务器",并且写过两篇关于深度学习服务器环境配置的文章:<深度学习主机环境配置: Ubuntu16.04+Nvidia GTX 1080+CUDA8.0> 和 <深度学习主机环境配置: Ubuntu16.04+GeForce GTX 1080+TensorFlow> , 获得了很多关注和引用. 这一年来,深度学习的大潮继续,特别是前段时间,吴恩达(And

深度学习主机环境配置: Ubuntu16.04 + GeForce GTX 1070 + CUDA8.0 + cuDNN5.1 + TensorFlow

深度学习主机环境配置: Ubuntu16.04 + GeForce GTX 1070 + CUDA8.0 + cuDNN5.1 + TensorFlow 最近在公司做深度学习相关的学习和实验,原来一直在自己的电脑上安装虚拟机跑,速度实在太慢,主机本身性能太弱,独显都没有,物理安装Ubuntu也没多大意义,所以考虑用公司性能最强悍的游戏主机(i7 6700+GTX 1070) 做实验,这台主机平时是用来跑HTC VIVE的,现在归我用了o(*≧▽≦)ツ. 原本以为整个一套安装下来会很顺利,一路火花

Desktop Ubuntu 14.04LTS/16.04科学计算环境配置

Desktop Ubuntu 14.04LTS/16.04科学计算环境配置 计算机硬件配置 cpu i5 6代 内存容量 8G gpu GTX960 显存容量 2G(建议显存在4G以上,否则一些稍具规模的神经网络无法训练,会提示显存容量不足) 配置顺序 安装包 重要依赖 安装ubuntu            14.04   安装显卡驱动         nvidia-367   安装cuda tool kit        8.0   安装cuDNN             v5 安装版本取决

CUDA学习日志:windows开发环境配置

接触CUDA的时间并不长,最开始是在cuda-convnet的代码中接触CUDA代码,当时确实看的比较痛苦.最近得空,在图书馆借了本<GPU高性能编程 CUDA实战>来看看. Jeremy Lin 什么是CUDA CUDA(Compute Unified Device Architecture)是一种专门为提高并行程序开发效率而设计的计算架构.在构建高性能应用程序时,CUDA架构能充分发挥GPU的强大计算能力.更多的介绍,可以参考NVIDIA的ABOUT PAGE. CUDA开发环境配置 在开

环境配置(近期实测)——Ubuntu16.04+CUDA9.0+tensorflow-gpu填坑记

近几年深度学习在物体检测方面出现了许多基于不同框架的网络模型,不同模型需要不同的版本的Python.TensorFlow.Keras.CUDA.cuDNN以及操作系统.不得不说,要把经典物体检测网络的源码都跑通,单配置环境就要浪费很多时间,因为目前兼容这些经典网络的框架和环境还很少.新版的TensorFlow在models的objection-detection模块中包含了fast-rcnn.rfcn.SSD几种网络,不过开发环境是基于Ubuntu的,因此我对该环境进行了配置. 1.Ubuntu

Windows10下 NVIDIA GeForce MX150 tensorflow-gpu 配置

引言 越来越多的的人入坑机器学习,深度学习,tensorflow 作为目前十分流行又强大的一个框架,自然会有越来越多的新人(我也刚入门)准备使用,一般装的都是 CPU 版的 tensorflow,然而使用 GPU 跑 tensorflow,速度可以快上好几倍.正好前段时间看到了使用小米pro(我目前使用的笔记本,感觉贼好用(我没有在推销))配置 gpu 的教程,就试了试,最后成功了. 环境 操作系统:Windows10 配置:Tensorflow 1.12 + CUDA 9.0 +cuDNN v