配置深度学习开发环境(Windows10 GPU)

发现一个非常方便的安装方法,应该具有广泛适应性,强烈推荐!!!在anaconda的基础上完成的,亲试,非常好用!

但是可能需要翻墙,是个国外的网页。

https://www.pugetsystems.com/labs/hpc/The-Best-Way-to-Install-TensorFlow-with-GPU-Support-on-Windows-10-Without-Installing-CUDA-1187/www.pugetsystems.com

下面是我自己琢磨出来的,可能不具有适应性,请酌情参考,

特别强调:版本匹配非常重要!

我安装并运行成功的各个部件的版本:

1、操作系统:Windows 10 64位

2、GPU:NVIDIA GeForce GTX 1050

3、GPU驱动: 385.54

4、visual studio community 2015

5、CUDA 9.0

6、cuDNN7.1.4

7、python 3.5.2

8、tensorflow-gpu 1.8

关于版本匹配的网站:

https://www.tensorflow.org/install/install_sources#common_installation_problemswww.tensorflow.org

我选择的是这个

具体安装步骤:

安装的软件从3-8 。

第一步:根据电脑的操作系统和GPU选择并安装对应版本的驱动

参考网页:

JustDoIT:windows tensorflow-gpu的安装zhuanlan.zhihu.com图标

NVIDIA官网下载驱动,下载地址如下:

NVIDIA 驱动程序下载www.nvidia.cn

下载驱动:

驱动安装成功!

第二步:安装visual studio community 2015

下载地址:

下载旧版 Visual Studio 软件 | Visual Studiovisualstudio.microsoft.com图标

切记一定要注意版本,否则后面在安装cuda的时候会出现错误!

不同版本可以参考这个官方指导:

CUDA Toolkit Documentationdocs.nvidia.com图标

比如我之前安装的是visual studio community 2017,结果cuda安装就是各种报错,错误我将总结在文章结尾。

最后换成了visual studio community 2015的版本,安装就顺利了。

第三步:安装cuda9.0

按照官方指导文件:

CUDA Toolkit Documentationdocs.nvidia.com图标


下载:

CUDA Toolkit 9.0 Downloadsdeveloper.nvidia.com

这里有个坑:可以正常下载,可是在安装是就会报错!

错误如下图所示:

官网提示原因是文件损坏。

奇怪的是当我(翻墙)用外网下载的就可以用!



编译成功!

编译出错请参考文章最后的错误总结。

测试安装是否成功:

deviceQuery.exe
bandwidthTest.exe

第四步:安装cuDNN

安装步骤按照官方指导文件:

Deep Learning SDK Documentationdocs.nvidia.com

目前对第五步还不知道是什么意思。没有进行,在网上查找之后发现很多网上的教程并没有这步,暂且搁置!希望以后懂了之后在来补充。

下载cuDNN:

https://developer.nvidia.com/rdp/cudnn-downloaddeveloper.nvidia.com

根据版本选择cuDNN的版本:

下载为本地文件:

解压:

把解压的文件复制到cuda的安装路径下(默认按装的路径如下图所示):

设置环境变量

control sysdm.cpl

CUDA_PATH

C:\ProgramData\NVIDIA GPU Computing Toolkit\v9.0


查看所安装的cuda版本

nvcc -V

查看所安装的cuda信息:

nvidia-smi

解决办法,把NVIDIA的安装默认位置添加到环境变量中去

即把上图所示的目录添加到环境变量中

第五步:安装python3.5.2

这步是通过安装anaconda完成的。

安装成功后,检测版本:

python -V

第六步:安装tensorflow-gpu 1.8

pip install tensorflow-gpu==1.8 -i https://pypi.douban.com/simple

如果出错可参考文章结尾的错误总结。

最后:用tensorflow object detection API 训练自己的神经网络

参考:

eric-erki/How-To-Train-an-Object-Detection-Classifier-for-Multiple-Objects-Using-TensorFlow-GPU-on-Windows-1github.com图标

按照上面的网址的方式配置相关项,在本地计算机上训练模型:

python train.py --logtostderr --train_dir=training/ --pipeline_config_path=training/faster_rcnn_inception_v2_pets.config

然而报错:

2018-07-19 10:37:36.734802: E T:\src\github\tensorflow\tensorflow\stream_executor\cuda\cuda_dnn.cc:396] Loaded runtime CuDNN library: 7104 (compatibility version 7100) but source was compiled with 7003 (compatibility version 7000). If using a binary install, upgrade your CuDNN library to match. If building from sources, make sure the library loaded at runtime matches a compatible version specified during compile configuration.

2018-07-19 10:37:36.745551: F T:\src\github\tensorflow\tensorflow\core\kernels\conv_ops.cc:712] Check failed: stream->parent()->GetConvolveAlgorithms( conv_parameters.ShouldIncludeWinogradNonfusedAlgo<T>(), &algorithms)

网上查找资料显示是版本不匹配的原因,把tensorflow1.7升级到1.8,

参考:

Loaded runtime CuDNN library: 7103 (compatibility version 7100)blog.csdn.net

成功的跑起来了!

错误总结

为避免文章太长,如果出现错误请参考下面的网址:

品颜完月:配置深度学习开发环境(采坑总结)zhuanlan.zhihu.com图标

编辑于 2019-03-01

文章被以下专栏收录