安装pytorch的gpu版本和一些问题的解决办法

1、安装anaconda:

我们使用anaconda来安装pytorch,至于为什么不用pip或者其他包管理工具,这边请您出门右转,不想多解释了。

a、安装

首先我们来到anaconda的镜像下载网站(使用官网下载比较慢,如果你会魔法当我没说)

anaconda的镜像下载站点击此处

博主这里以64位Windows10系统为例。

注意看旁边的发行日期,选择自己合适的,博主这里选择anaconda3-2022.10安装。

x4sDT1.png

注:安装过程中会让你选择安装地址,anaconda3一开始不打,但是随着使用,会越来越大,所以建议不要安装在C盘

b、然后是给anaconda3换源:

anaconda本来的源在国外,下载都会很慢,所以我们换用国内的源,这里我们选用清华的镜像源。

打开cmd,输入conda info即可看到当前的channel,接下来我们在cmd里输入:

1
2
3
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes

然后打开.condarc问件(文件位置位于C:\Users\用户名),删去-default一行;

然后是一些创建、激活、关闭、删除环境的指令:

1、创建环境

1
conda create -n 环境名

2、激活环境

1
Conda activate 环境名

3、关闭环境

1
deactivate 环境名

4、删除环境

1
conda remove -n 环境名 --all

5、查看现有环境

1
conda info --envs

2、安装cuda和cudnn

a、安装cuda

安装cuda首先要确定本机的显卡驱动的版本号,在cmd输入nvidia-smi即可查看

x4WM9I.png

得到这个版本号后在如下的表中找到对应的cuda版本

x4WNNj.png

这里为了防止后续更新后此表落后,这里贴上表的来源网址。

点我看表

如果你的显卡驱动太低,可以先选择更新显卡驱动。

我这里就选择了CUDA-11.6安装

点我跳转cuda安装地址

点上面的链接后跳转到如下页面,找到自己对应的版本,点击,我这里就选11.6.2了。

x4fSr8.png

点击后会进入一个如下的选择界面。

按照我如图的选择后会出现download按钮,点击即可下载。

x4fkPs.png

下载完成后,双击下载的文件即可开始安装,这里建议不要更改下载位置,因为我在安装过程中发现,即使我更改到其他盘,在安装后,我自己创建的那个文件夹直接不见,且C盘空间被占用,说明还是装到C盘了。这样的话由于我改过路径,花了好一会才找到文件,所以建议不要更改安装路径。

但是第二步选择时候,选择自定义安装,把除了CUDA的选项都去掉。同样会再次遇到一次配置路径的选择,还是不要改,但是要记住路径位置(下面一步要用)。接下来等就OK了。

测试安装是否成功:

在cmd中输入nvcc —version

1
nvcc --version

如果正常出现版本号则说明安装成功。

如果没有,则去 “ NVIDIA GPU Computing Toolkit\CUDA\v11.6\bin ” 这个文件夹下检查有无nvcc.exe文件,有的话,复制上面的地址,给电脑加个环境变量,如果没有的话,说明安装失败。

b、安装cudnn

点我进入下载cudnn的网站

注:下载cudnn需要登录英伟达账号,没有账号的同学请先注册。

找到对应自己cuda版本的点击下载。

x4hVFH.png

下载完成后解压获得:

x4hUlq.png

将bin、include、lib三个文件夹复制到cuda安装路径下同样有这个三个文件夹的目录下,中途应该会遇到 “ 你必须提供管理员资格··· ” 之类的话,直接点击 “ 允许 ” 或者 “ 继续 ” 之类选项。

这里检验下cudnn是否安装成功,从命令行进入 “ cuda安装位置\版本号\extras\demo_suite “ ,输入bandwidthTest.exe,见到Result = PASS则说明cudnn安装成功,如图。

x4hgpR.png

3、安装pytorch

推荐使用通过conda创建虚拟环境来安装pytorch。

首先创建虚拟环境,打开cmd,输入:conda create -n 环境名字 python=X.X。

1
conda create -n 环境名字 python=X.X

然后激活环境,输入:

1
conda activate 环境名

进入下载pytorch的网站,查看安装指令。

点我进入网站

x4425Q.png

复制这个指令到刚刚激活了环境的cmd内回车,但是注意,这里-c pytorch 会走国外线路,原来换的源就没用了,同样的-c forge也会走

“ conda-forge ”的channel,我尝试过指删前者,发现会报错,安装失败,不删有要走外源,速度极慢,博主当时下了一晚上,结果timeout也同样失败,寄了,多次尝试后,我使用如下指令,安装成功:

1
conda install pytorch torchvision cudatoolkit=版本号

其实好像把后面两个-c都删了就可以了,有兴趣同学可以自行尝试。

安装完成后我们来测试一下,在cmd输入python,然后输入如下两个指令:

1
2
import torch
torch.__version__

正常运行,没有报错就说明安装成功了,这里我多引用了一次是我手贱多点了一次。

x45nqf.png

OK,今天的pytorch安装就到这里了,我过程中还遇到过许多报错,但是现在忘了,如果大家遇到报错可以在评论区提出来,博主看到会在力所能及范围内解答。