Win10 RTX3070 安装tensorflow1.15失败经历
Win10 RTX3070 安装tensorflow1.15失败经历
- 安装tf1.15的原因
- 使用cuda10
- 使用cuda11.1
- 下载tf1.15之前先安装cudatoolkit11
- 进一步的打算
安装tf1.15的原因
NLP小白,意外的了解到全球人工智能技术创新大赛想要学习一些新的知识,比赛中有大佬开源的baseline使用的环境是tensorflow1.15,因此我就开始了曲折的环境配置之路。
使用cuda10
首先意识到的是tensorflow1.15需要的是cuda10,因此我安装了cuda10。全部安装完成调用tf也不会报错,看似十分完美,但是在真正跑代码时会出现无法从CUP–GUP这样的错误(忘记截屏了)。
使用cuda11.1
在意识到30系显卡只支持cuda11.0以上版本时,又安装了cuda11.1,但是这时还是不能使用GUP跑代码。因为前面下载tf1.15的时候使用conda install tensorflow-gup=1.15下载的时候里面已经包括cudatoolkit10了。
下载tf1.15之前先安装cudatoolkit11
经过一段时间的百度搜索,我查到是可以先安装cudatoolkit11,然后在安装tf1.15
conda install cudatoolkit=11
然后使用
pip install tensorflow-gup==1.15
安装完了之后开始报另一种错误cudart64_100.dll等dll文件不存在。然后查到可以把cudart64_10.dll等之类的文件名直接改成cudart64_100.dll之类的文件。
然后使用
import tensorflow as tf
print(tf.test.is_gpu_available())
查看tf是否可用,确实可以返回true。但是在运行大佬的baseline时又会出现另一种错误:
继续查有大佬说是显存不够,,虽然我的显存只有8G但是应该不至于不够吧(模型是bert-base)。
这里我没有查到合适的解决办法,我也有试过用CPU跑,但是真的太慢了。
进一步的打算
准备装Ubuntu18.04试试,看到有大佬用Ubuntu好像成功使用RTX30系列了。
可能最后真的是我的显存不够,我写的可能也有很多的错误,我十分希望有大佬可以指出我的错误,这样我就不用去折腾Ubuntu了。
参考比较多,给出部分链接:
[1]:
[2]:=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromMachineLearnPai2%7Edefault-3.control&dist_request_id=&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromMachineLearnPai2%7Edefault-3.control
更多推荐
Win10 RTX3070 安装tensorflow1.15失败经历
发布评论