admin管理员组

文章数量:1572326

Win10系统从NVIDIA driver版本匹配开始配置Keras训练环境

由于最近只能使用Windows系统训练神经网络,但是程序总是不调用GPU而拖慢了工作进度,因此踏上了配置环境的不归路,在此记录一下配置环境的真正流程和我遇到过的所有坑,希望对大家有所帮助。


文章目录

  • Win10系统从NVIDIA driver版本匹配开始配置Keras训练环境
  • 一、确定要安装的TensorFlow-GPU、CUDA、cudnn的版本
  • 二、安装NVIDIA显卡驱动
    • 1.查看显卡驱动版本是否满足CUDA版本的要求
    • 2.更新驱动版本
  • 三、安装CUDA
    • 安装失败解决办法
  • 四、安装cuDNN
    • 环境变量添加方法:
  • 五、安装TensorFlow-gpu
    • 验证tensorflow-gpu是否安装成功:
    • import tensorflow as tf 时报错FutureWarning: Passing (type, 1) or '1type' as a synonym of type is deprecated;....(如下图)
    • 安装numpy1.16时报错:tensorflow 1.14.0 requires google-pasta>=0.1.6, which is not installed.(如下图)
  • 六、在pycharm的python脚本中调用GPU跑神经网络模型
    • 添加配置好的虚拟环境的python解释器
  • 七、Inference

一、确定要安装的TensorFlow-GPU、CUDA、cudnn的版本

根据要安装的tensorflow-gpu版本查看需要安装的CUDA和cudnn版本

例如,我需要安装的是tensorflow-gpu 1.14.0,因此需要安装CUDA10,和cuDNN7.4

二、安装NVIDIA显卡驱动

1.查看显卡驱动版本是否满足CUDA版本的要求

可在这里查看:

NVIDIA驱动版本查看方式:开始菜单——>NVIDIA control panel——>系统信息

2.更新驱动版本

若显卡驱动不满足要求,则需要更新驱动版本,步骤如下:
(1)查看显卡型号:如上图所示(开始菜单——>NVIDIA control panel——>系统信息)
(2)在此处下载显卡型号对应的驱动版本。Windows驱动程序类型,也在上图系统信息里查看。最新栏里选择Studio驱动程序。下载后安装即可

三、安装CUDA

(1)在此处选择需要的CUDA版本,下载并安装。(选择精简安装,取消勾选创建快捷方式)

安装失败解决办法

若安装失败如下图原因:

则选择自定义安装,取消勾选Visual Studio Intergration后再进行安装

(3)验证CUDA是否安装成功

进入CUDA的安装路径,并复制此路径

进入cmd命令窗,切换到安装目录下,执行nvcc -V指令,如下图所示即安装成功

四、安装cuDNN

在这里下载cuDNN与CUDA对应的版本。(下载时需要自行注册和登录账户),下载后解压文件夹,cuDNN安装过程如下:
若cuda 安装目录:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0
(1)把 cudnn 解压包下的:cuda\bin\cudnn64_7.dll 复制到:cuda安装目录\bin
(2)把 cudnn 解压包下的:cuda\include\cudnn.h 复制到:cuda安装目录\include
(3)把 cudnn 解压包下的:cuda\lib\x64\cudnn.lib 复制到:cuda安装目录\lib\x64
说明:复制过程不会有重复文件需要覆盖,如果有,说明cuDNN下载的版本有问题,请自行检查,可在这里参考

为防止出现未知错误,cudnn安装完成后,把 3 个路径加入 环境变量\用户变量\path 中:
(1)C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\bin
(2)C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\include
(3)C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\lib\x64

环境变量添加方法:

控制面板——>系统——>高级系统设置


(2)验证cuDNN安装是否成功
进入下图路径,分别执行bandwidthTest.exe和deviceQuery.exe两个程序,如下图便是安装成功:


五、安装TensorFlow-gpu

(1)打开Anaconda Prompt(conda -V命令可查看anaconda版本,conda info --envs命令可查看已存在的虚拟环境信息)

(2)创建虚拟环境

conda create -n env_name python=3.6  # env_name是自己命名的虚拟环境名

(3)进入虚拟环境

conda activate env_name

(4)安装tensorflow-gpu版本
此处千万不要安装tensorflow的cpu版本,不然程序默认调用cpu版本,安好后再卸载cpu版本会导致很多错误,我就是栽在这里重安装了好几次。

conda install tensoflow-gpu=1.14

验证tensorflow-gpu是否安装成功:

在Anaconda Prompt中输入如下命令

>>> python
>>> import tensorflow as tf
>>> print(tf.__version__)
>>> print(tf.test.is_gpu_available())

若如下图所示,则tensorflow-gpu安装成功

import tensorflow as tf 时报错FutureWarning: Passing (type, 1) or ‘1type’ as a synonym of type is deprecated;…(如下图)


报错原因:这是由于numpy1.19.1版本过高造成,需要降至1.16.0
解决办法:退出python程序,重新安装numpy1.16.0

>>> exit()
>>>pip install numpy==1.16

安装numpy1.16时报错:tensorflow 1.14.0 requires google-pasta>=0.1.6, which is not installed.(如下图)


解决办法:

>>>pip install google-pasta==0.1.6

六、在pycharm的python脚本中调用GPU跑神经网络模型

添加配置好的虚拟环境的python解释器




p36是刚刚配置好的虚拟环境的文件夹


至此我们配置好的tensorflow-gpu已关联到了当前项目


七、Inference

Windows 10 安装 nvidia driver,cuda,cudnn,anaconda,tensorflow

本文标签: 版本环境系统NVIDIAkeras