CentOS7.X安装英伟达显卡采坑之路

1、系统信息

操作系统版本:CentOS7.X

显卡版本:英伟达 Tesla P100

其他软件包安装信息:

  • CUDA 9.0
  • CUDNN 7.4.2.24
  • lightgbm 2.2.X
  • Boost 1.61
  • CMake 3.12

特别说明,如果没有在官网找到你的显卡版本对应的驱动,请尽快寻找你的显卡提供商确认驱动信息,不要轻易尝试;那就是在浪费时间,切记!

2、安装P100驱动

这里安装P100驱动的方式,通过Yum Rpm包的安装方式,其他相关的Linux系统可以通过对应的包管理或者二进制的方式安装,如果是CentOS系统,我们非常推荐使用Yum进行安装。

2.1 查看显卡信息

我们可以通过查看pci的接口,确认显卡信息,以及是否识别出显卡,当然默认没有这个工具,我们需要安装;安装方式如下:

yum install pciutils -y

可以通过过滤VGA来精确信息:

lspci|grep -i vga

2.2 安装显卡驱动

这里我们通过wget在线下载驱动,通过rpm安装载入到系统中:

wget http://cn.download.nvidia.com/tesla/410.79/nvidia-diag-driver-local-repo-rhel7-410.79-1.0-1.x86_64.rpm
rpm -ivh nvidia-diag-driver-local-repo-rhel7-410.79-1.0-1.x86_64.rpm 

在往下走之前我们需要配置epel源,便于后面安装dkms

yum install epel-*

通过Yum安装,目前这是最简单的方式,如果你想挑战也可以采用二进制tarall的方式:

yum install dkms -y
yum install nvidia* -y

最后为了生效,我们需要重启操作系统:

reboot

往往重启后,你不确定是否成功,那如果去查看信息呢,我推荐通过一下三个步骤:

lspci | grep -i nv         # 查看是否加载驱动配置
lsmod | grep -i nouveau    # 是否关闭了默认显卡驱动
dmesg | grep NVRM          # 查看开启加载是否有异常信息

到了这里,成责成,不成你就要日志了,别照着网上文章乱搞。

3、开发工具包安装

只有驱动还是不够的,我们换需要一个些工具包便于我们使用,其中 CUDA、CUDNN就是我们要安装的包。

3.1 CUDA工具包安装

导入官方CUDA包

rpm -ivh http://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/cuda-repo-rhel7-9.0.176-1.x86_64.rpm

通过Yum安装即可

yum install cuda-9.0.176-1

我们推荐不要安装太新的,好多组件不一定能够支持。

查看版本技巧:yum search --showduplicates cuda

3.2 CUDNN安装

PS:下载CUDNN,你可能需要一个会员,需要登录才能够下载

Download下载地址: https://developer.nvidia.com/compute/machine-learning/cudnn/secure/v7.4.2/prod/9.0_20181213/cudnn-9.0-linux-x64-v7.4.2.24.tgz

上传到服务器上后,解压Copy对应的库文件即可(这里我们默认你已经回上传文件到服务之上):

tar xf cudnn-9.0-linux-x64-v7.4.2.24.solitairetheme8
cp cuda/include/cudnn.h /usr/local/cuda/include
cp -a cuda/lib/* /usr/local/cuda/lib64/

4、lightgbm安装

这个安装对于CentOS7的系统是非常坑的,必须要来编译原声的组件,编译失败的因素很多,你准备好了?

4.1 OpenGL安装

安装OpenGL,默认情况下CUDA安装时已经安装,所以无需单独安装;(特别注意,有时候会遇到软连接丢失造成找不到so库文件),解决方法就是补全软连接即可了。

PS:补全方式,类似常规方法,通过ln 命令模拟确实的so文件即可。

4.2 Boost安装

安装前,你需要安装一些依赖,来保证后面的步骤能够顺序执行(我并不能保证你按照我的方式一定会成功,但至少我成功了,如果出错你需要详细检查报错信息+你的机智来解决问题)

yum install wget gcc python python python-devel -y

安装命令如下,你可以直接Copy执行(在Root身份下)

cd /usr/local/src
wget https://sourceforge.net/projects/boost/files/boost/1.61.0/boost_1_61_0.tar.gz
tar xf boost_1_61_0.tar.gz
cd boost_1_61_0
./bootstrap.sh --prefix=/usr/local/include/boost
./b2 install

我们还需要安装tools工具,放心这个不会报错,锦上添花的功能:

cd tools/build/
./b2 install --prefix=/usr/local/include/boost

4.3 CMake安装

没有什么特别好说的,常规操作(你在Root身份下直接复制即可):

cd /usr/local/src
wget https://cmake.org/files/v3.12/cmake-3.12.0-rc1.tar.gz
tar -zxf cmake-3.12.0-rc1.tar.gz
cd cmake-3.12.0-rc1
./bootstrap
gmake -j $(nproc)
gmake install

检查是否成功与查看版本:

cmake --version

4.4 正文lightgbm

PS:开始前,我们认为已经安装了Python3的环境,当然Python2也是可以的,不过你需要做好心理准备。

命令如下:建议Root用户或等同权利的用户执行

cd /usr/local/src/
git clone --recursive https://github.com/Microsoft/LightGBM ; cd LightGBM
mkdir build ; cd build
cmake -DUSE_GPU=1 ..
cd python-package/
python3 setup.py install

将so动态库Copy到系统之中,自行操作,不在演示。

4.5 测试

安装基础测试数据包:

pip3 install wheel numpy scipy scikit-learn -U -i https://pypi.doubanio.com/simple

下载解析处理数据:

cd /usr/local/src
git clone https://github.com/guolinke/boosting_tree_benchmarks.git
cd boosting_tree_benchmarks/data
wget "https://archive.ics.uci.edu/ml/machine-learning-databases/00280/HIGGS.csv.gz"
gunzip HIGGS.csv.gz
python3 higgs2libsvm.py

PS: 这里你可能会遇到xrange错误,因为Python3已经没有xrange,这里修改为range即可。

创建测试数据:

cat > lightgbm_gpu.conf <<EOF
max_bin = 63
num_leaves = 255
num_iterations = 50
learning_rate = 0.1
tree_learner = serial
task = train
is_training_metric = false
min_data_in_leaf = 1
min_sum_hessian_in_leaf = 100
ndcg_eval_at = 1,3,5,10
sparse_threshold = 1.0
device = gpu
gpu_platform_id = 0
gpu_device_id = 0
EOF
echo "num_threads=$(nproc)" >> lightgbm_gpu.conf

测试命令如下:

# Run of GPU
/usr/local/src/LightGBM/lightgbm config=lightgbm_gpu.conf data=higgs.train valid=higgs.test objective=binary metric=auc
# Run of CPU
/usr/local/src/LightGBM/lightgbm config=lightgbm_gpu.conf data=higgs.train valid=higgs.test objective=binary metric=auc device=cpu

这里可以将生成的lightgbm命令与So文件Copy到系统之中方便后期使用。

5、小结

看到这里说明你已经成功了,是不是很Easy,当然如果你没搞定回头看看错误信息;我的这个博文你不一定能够成功,至少我成功过了,切记不要根据网上的帖子乱搞。

原文地址:https://www.cnblogs.com/evan-blog/p/10328187.html

时间: 2024-08-29 09:57:35

CentOS7.X安装英伟达显卡采坑之路的相关文章

64-bit Linux安装英伟达显卡驱动

我使用64位的debian 8.6在安装英伟达显卡驱动时遇到了一个waring导致我的显卡驱动始终无法安装成功 在网上搜索了一番后,我解决了这个问题,现在记录下来为遇到同样问题的人提供下资料 警告原话如下: WARNING: Unable to find a suitable destination to install 32-bit compatibility libraries. Your system may not be set up for 32-bit compatibility.

ubutn下安装英伟达显卡驱动

这篇文章都是参考这儿的 最近,在一台比较老的PC上装了ubuntu 14.04,安装过程中时不时花屏,开机输入密码后直接花屏卡死,最后google确认是ubuntu的开源驱动,对较老的NVIDIA显卡驱动有问题.so,看到一篇不错的英文文档,决定翻译并收藏下来. 在Ubuntu 14.04/13.10/13.04/12.10/12.04/11.10/11.04/10.04安装使用最新的NVIDIA GeForce显卡驱动(version 304.108/319)使用PPA(Personal Pa

英伟达显卡休眠或睡眠启动后花屏的解决

笔者的情况是,前几天单位某位同事淘汰下来的NVIDIA QuadroK4200显卡被我给捡来了,相比我原来的KXXX不知道好了多少倍.像是捡到了一个宝贝,感觉很好.但是发现用鲁大师安装后,每次睡眠重启后界面都是有重影的,而我又是那种比较节省电力的人,电脑肯定需要休眠或睡眠的.最近一周断断续续的试过驱动卸载重装.显卡拔掉重装.分析过是否为供电不足造成的等等,也折腾了很久.最终发现还是驱动的原因. 解决办法: 别人建议我安装一个稍微旧版本的显卡驱动,而我发现还不好找,一下子有着想试试最新版本驱动的想

CUDA 6.0 安装及配置( WIN7 64位 / 英伟达G卡 / VS2010 )

前言 本文讲解如何在VS 2010开发平台中搭建CUDA开发环境 当前配置: 系统:WIN7 64位 开发平台:VS 2010 显卡:英伟达G卡 CUDA版本:6.0 若配置不一样,请勿参阅本文. 第一步 点击这里下载 cuda最新版,目前最高版本是6.0.下载完毕后得到 cuda_6.0.37_winvista_win7_win8.1_general_64.exe 文件. 第二步 运行安装程序,弹出安装过程中转文件路径设定框: 这个路径随便填无所谓,安装完后就会自动删除的,我就直接设置为默认的

Ubuntu16.04.5 配置英伟达NVIDIA 显卡 驱动实现GPU加速

Ubuntu16.04.5 配置英伟达NVIDIA 显卡 驱动实现GPU加速 标签(空格分隔): 运维系列 一:系统环境初始化与系统包准备 二:安装测试步骤 一:系统环境初始化与系统包准备 apt-get update apt-get install vim openssh-server 准备系统所需要的安装包 NVIDIA-Linux-x86_64-440.44.run cuda_10.2.89_440.33.01_linux.run 二:安装测试步骤 1.1 安装Nvidia显卡驱动 1.

GPU技术大会感受--专注显卡解决方案十年,英伟达在人工智能上创造出另外一副天地!

十年前谁也不会想到,人工智能让英伟达走到了风口浪尖 今天去了GTC(GPU技术大会),和大家分享下一些见闻.如今的英伟达进入了高速发展阶段,但是谁也没有想到,英伟达在显卡上专注了十几年,居然在AI上有很大的发展,遥想当年,电脑上显卡和声卡是标配,显卡有英伟达和ATI,声卡称霸的是创新的,而现在基本已经听不到创新声卡的生意,显卡反而因为挖矿,人工智能更加生机勃勃. 顺便说下,GPU这个词,也是英伟达1999年最先提出来的. 大会开场先是一段震撼的视频 然后黄老板上场了,因为黄老板是华人,大家可能觉

英伟达失去手机与平板市场:拖延症惹的祸

据PCWorld报道,英伟达将放弃移动设备市场出售3G和LTE调制解调器业务.英伟达周二表示,将在2016财年第二季度前关闭Icera调制解调器业务,并出售其资产.英伟达将许可第三方的调制解调器技术,为其Tegra芯片搭配LTE连接技术. 2011年,当英伟达斥资3.67亿美元(约合人民币22.44亿元)收购Icera的调制解调器业务时,人们一度对其前景非常看好.如今却沦落成打包出售的处理品,当年的小甜甜是如何变成牛夫人的呢?我们来看一下. 一.当年的小甜甜 2011年距离现在并不算太远,我们回

玩深度学习选哪块英伟达 GPU?有性价比排名还不够!

本文來源地址:https://www.leiphone.com/news/201705/uo3MgYrFxgdyTRGR.html 与"传统" AI 算法相比,深度学习(DL)的计算性能要求,可以说完全在另一个量级上. 而 GPU 的选择,会在根本上决定你的深度学习体验.那么,对于一名 DL 开发者,应该怎么选择合适的 GPU 呢?这篇文章将深入讨论这个问题,聊聊有无必要入手英特尔协处理器 Xeon Phi,并将各主流显卡的性能.性价比制成一目了然的对比图,供大家参考. 先来谈谈选择

英伟达+联想2015校招笔试回忆(嵌入式方向,上海)

好久没写Blog个了,过去几月技术也没见得增长多少,来来回回的一直在做事情,要毕业找工作了却发现也没静下来去准备过,这不临时抱佛脚那感觉是必死的啊.本科没尝试,这再不尝试那就真没机会了. 2014年10月11,12两天参加的两场笔试只在上海进行且都只有一次,只好从杭州到上海去混了两天.回忆着两场笔试,目测基本都跪了,把大致考的题目回忆下,也算留下点东西吧. 1.英伟达embedded system software engineer.全英文+全英文答题+破地方找不到迟到半小时多,泪奔. a,解释