Ubuntu 18.04 nvidia driver 390.48 安装 TensorFlow 1.12.0 和 PyTorch 1.0.0 详细教程

最近要在个人台式机上搭建TensorFlow和PyTorch运行环境,期间遇到了一些问题。这里就把解决的过程记录下来,同时也可以作为安装上述环境的过程记录。

如果没有遇到类似的问题,想直接从零安装上述两个包的运行环境的,请直接阅读第三部分

一、硬件和环境配置:

1)操作系统:Ubuntu 18.04;

2)NVIDIA Driver Version :390.48;(可通过nvidia-smi命令查到)

3)GPU:GTX 1080; (可通过nvidia-smi命令查到)

4)已安装CUDA Toolkit 9.1; (可通过nvcc --version命令查到)

5)已安装Anaconda3。

二、问题描述及解决过程:

1)在安装Anaconda3后,创建名为mydev的虚拟环境

conda create --name mydev

2)随后

source activate mydev

启用虚拟环境

3)安装torch1.0.0和tensorflow1.12.0

conda install -c pytorch pytorch

conda install tensorflow-gpu

4)安装完成后,检测上述两个包是否均能够使用GPU进行训练

pytorch的测试代码:

# -*- coding: utf-8 -*-
from __future__ import print_function
import os
import torch

cuda = torch.cuda.is_available()
if cuda:
    print(‘OK! CUDA device detected.‘)
else :
    print(‘Error, CUDA device NOT detected.‘)

tensorflow的测试代码:

import tensorflow as tf
print(tf.test.is_gpu_available())

测试结果:

pytorch测试结果显示:OK! CUDA device detected.

tensorflow测试结果显示:False.

说明torch可以检测到GPU但是tensorflow没检测到GPU。

5)开始查错。首先

source deactivate

退出当前虚拟环境

6)然后

source activate mydev

重新进入虚拟环境,

conda list

让conda列出当前虚拟环境下安装的所有包的信息,目的是查看包的版本

发现一个名为cudatoolkit的包,其版本是9.2,是随着tensorflow一并安装到虚拟环境内的。看似没有什么问题。

7)在当前虚拟环境内进入python

python

在python内,敲入:

>>> import tensorflow as tf

>>> tf.__file__

>>> tf.__version__

来获取tensorflow的安装位置,我们要检查一下tensorflow到底安装到了哪里,以及版本对不对。

从python的输出结果来看:

tensorflow的版本是1.10.0,而且位置也不对,被安装到了~/.local/lib/python3.6/site-packages/...目录下,而不是类似~/anaconda3/envs/mydev/...下。

同样类似的问题也出现在了pytorch上。

突然回想起来电脑刚装完驱动和CUDA Toolkit的时候,可能用过pip安装过tensorflow,而且当时没有意识到tensorflow有CPU和GPU版本之分,就误安装了tensorflow1.10的CPU版,而pip安装的包会优先于conda虚拟环境内安装的包,所以都乱套了。

8)根据上面的发现,我们要退出当前虚拟环境,

source deactivate

然后在主环境内

pip uninstall tensorflow

pip uninstall torch

卸载掉这两个旧的包。

9)卸载之后,再

source activate mydev

进入虚拟环境,运行tensorflow的测试代码,显示

cudaGetDevice() failed. Status: CUDA driver version is insufficient for CUDA runtime version

意思是CUDA驱动版本和CUDA运行库版本不匹配,这是由于之前所说的cudatoolkit版本是9.2,版本过高造成的。

10)于是根据出错信息上网搜解决措施,发现在conda虚拟环境内,利用

conda update --all

可以使conda意识到在当前虚拟环境内,包之间的版本依赖问题,敲入上述指令后,发现conda提出的解决方案中,将cudatoolkit降级为9.0,pytorch降级为0.4.1。

于是很欣慰的敲入上述指令并运行,发现tensorflow可以发现GPU了。

11)第10步中我们降级了pytorch,所以我们要重新安装pytorch为1.0.0版:

conda install -c pytorch pytorch

12)完整操作后,我们就有了tensorflow1.12.0和pytorch1.0.0了~

三、上述的环境配置全过程整理

1)首先,如果您的电脑之前利用pip命令曾经安装过tensorflow或者pytorch,请用

pip uninstall tensorflow

pip uninstall torch

在pip中卸载掉这两个包。

2)随后按照如下步骤操作:

创建虚拟环境

conda create --name mydev

进入虚拟环境

source activate mydev

安装tensorflow和pytorch

conda install -c pytorch pytorch

conda install tensorflow-gpu

让conda再次整理包间的依赖

conda update --all

重新安装pytorch

conda install -c pytorch pytorch

3)测试安装好的两个包是否均支持GPU,测试代码已在上面给出。

四、总结

1)安装tensorflow时,一定要写tensorflow-gpu而不是tensorflow,否则安装的是tensorflow的CPU版而不是GPU版。

2)理论上来说,pip和conda命令是冲突的。pip解决的是python内包之间的依赖问题,而conda的目标是管理任何编程语言之间的包的依赖问题。所以根据喜好,以后尽量使用二者中的一个。

3)当包的状态不对时,可以利用packageName.__version__和packageName.__file__可以查看包的版本和安装位置。

原文地址:https://www.cnblogs.com/time-flow1024/p/10308266.html

时间: 2024-08-02 18:00:46

Ubuntu 18.04 nvidia driver 390.48 安装 TensorFlow 1.12.0 和 PyTorch 1.0.0 详细教程的相关文章

Ubuntu 18.04 下 emscripten SDK 的安装

Ubuntu 18.04 下 emscripten SDK 的安装 http://kripken.github.io/emscripten-site/docs/getting_started/downloads.html#installation-instructions 需要环境 清华安装源 https://mirrors.tuna.tsinghua.edu.cn/help/ubuntu $ sudo apt update $ sudo apt install vim openssh-serv

Ubuntu 14.04 Nvidia显卡驱动手动安装及设置

更换主板修复grub 引导后,无法从Nvidia进入系统(光标闪烁), 可能是显卡驱动出了问题. 1. 进入BIOS设置, 从集成显卡进入系统 将显示器连接到集显的VGI口, 并在BIOS中设置用集显显示, 一般来说可以成功进入系统. 2. 完全写在Nvidia驱动 (参考) 执行下列命令干干净净卸载nvidia驱动, sudo apt-get remove --purge nvidia-* sudo apt-get install ubuntu-desktop sudo rm /etc/X11

Ubuntu 18.04 下 PostgreSQL 10 的安装与基础配置

下载安装 在命令行执行如下语句: apt-get install postgresql-10 该指令会帮助你下载如下PostgreSQL组件: ` | ` -- | -- postgresql-client-10 | client libraries and client binaries postgresql-10 | core database server postgresql-contrib-9.x | additional supplied modules (part of the p

Ubuntu 18.04 下用命令行安装Sublime

介绍: 添加来源: $ wget -qO - https://download.sublimetext.com/sublimehq-pub.gpg | sudo apt-key add - $ sudo apt-add-repository "deb https://download.sublimetext.com/ apt/stable/ 安装sublime $ sudo apt update $ sudo apt install sublime-text 原文地址:https://www.c

Ubuntu 18.04.1 下快速搭建 LNMP环境(PHP7.2.5+MySql5.7+Nginx1.14.0)

在Linux环境下,搭建LNMP环境,大家以前或多或少都做过相关的操作,但是随着软件的更新,PHP,MySQL不断的升级,以往很多比较老的教程,都已经无法完成这个搭建环境的任务了,今天偶然有兴趣在最新的Ubuntu18.04上搭建LNMP环境,本来感觉挺容易的,但是在实际操作过程中,遇到一个个坑,真是让人哭笑不得,所以写这篇心得,主要是分享在搭建过程中遇到的一些问题进行了整合,来给后入进行排雷. 首先展示搭建成功后的页面 PHP安装成功 MySQL安装成功 来,现在我们开始进行搭建 1.Ngin

Ubuntu 18.04 安装java8

OpenJDK和Oracle Java有两个主要的实现,几乎没有区别,只是Oracle Java有一些额外的商业功能. 安装OpenJDK OpenJDK 10,Java平台的开源实现是Ubuntu 18.04中的默认Java开发和运行时. 一旦OpenJDK 11达到GA,它将成为Ubuntu 18.04的默认版本. 安装OpenJDK非常简单直接. 安装OpenJDK 10 JDK sudo apt install default-jdk 安装OpenJDK 8 JDK sudo apt i

Ubuntu 18.04 安装youtube-dl 与 FFMPEG心得!

Youtube-dl是一款不错的Youtube视频下载工具与FFMPEG配合可以在主机上很轻松的下载Youtube上的任意可视视频. 关于Youtube-dl的教程网上多的很.基本上都只说明了安装步骤.却没有说明使用是报错问题的解决与修正. 这次本文连同安装与错误解决方案一同说明. 1.Youtube-dl基本支持三种系统.Centos .Ubuntu.Windows.个人感觉Ubuntu 安装时比较容易看懂.使用是在压制视频时比其他两个系统都要显得略好一些. 2.本文就用Ubuntu 18.0

Win10+WSL2+Ubuntu 18.04(WSL下)+VS Code(Win10下)+TexLive 2019(Ubuntu下)安装和配置

本人手头电脑是Win10 Home版全新安装的系统,由于不想在新系统盘里面安装TexLive导致固态硬盘不断扩大,所以,考虑安装Ubuntu做为WSL,然后把TexLive安装在Ubuntu,并通过VS Code调用Ubuntu命令来写Latex的方法来写一些论文.在此,提供一个思路给大家借鉴. Windows 10安装WSL2和Ubuntu 18.04 这个过程其实直接参照微软的标准过程就可以了,大致步骤总结如下: 去控制面板开启Virtual Machine Platform和Windows

Ubuntu 18.04 系统U盘安装与初步设置

Ubuntu 18.04 系统U盘安装与初步设置一.Ubuntu 18.04 单系统U盘安装二.其他设置开启ROOT账号,设定IP地址,安装启动Telnet,修改时区Ubuntu 18.04 单系统U盘安装一. Ubuntu 18.04 u盘启动盘制作? 制作环境Windows 10? Ubuntu系统镜像 ubuntu-18.04.2-live-server-amd64.iso(https://ubuntu.com/download/server)? U盘 我使用32G? 软件 rufs-3.