高算平台配置本地pytorch1.6及cuda环境搭建

  1.工作环境:(去网上下载)

  Xshell、FinalShell、Xftp等。

  2.软件及下载列表:

  Anaconda3(服务器上的版本是Anaconda3-2020.11-Linux-x86_64.sh 528M 里面带的python版本是3.8的)

  Cuda(cuda_10.0.130_410.48_linux.run 1.8G) 服务器上的没有.run,自己加上就行。

  Cudnn(cudnn-10.0-linux-x64-v7.4.1.5.tgz 403M)

  这里安装的是cuda10.0版本的。其安装程序在/apps/soft/installpkg目录中有,可以不用再去网上下载,网上下载也可以。不管是服务器上的还是网上下载的,都要放到自己的家目录下才能安装。

  Pytorh版本:1.6.0,对应cuda10.0,注意依赖包之间版本的对应关系。

  pytorch-1.6.0-py3.8_cuda10.1.243_cudnn7.6.3_0.tar.bz2

  torchvision-0.9.0-py38_cu101.tar.bz2

  cudatoolkit-10.1.243-h6bb024c_0.tar.bz2

  安装时要拷贝到自己的家目录下才能安装。注意这里的版本号,python要用3.8的,cudatoolkit可以使用10.1的,虽然前面cuda用的是10.0的。

  3.安装顺序:

  先安装Anaconda3,这一步基本没什么问题

  再安装cuda和cudnn,然后在线安装pytorch, torchvision, cudatoolkit这三个就行了。以下两张截屏可以参考:最后那两个命令是验证是否安装正确:

  

  

  4.安装命令参考:

  注意:Linux是区分大小写的,如果文件名是小写,命令中一定要小写文件名。

  (1)安装anaconda3的命令:

  bashanaconda3-2020.11-Linux-x86_64.sh

  (2)安装cuda的命令:

  chmod+x cuda_10.0.130_410.48_linux.run

  http://webplus.chd.edu.cn/_s230/2022/0313/c10025a212757/cuda_10.0.130_410.48_linux.run

  具体内容看显示说明就行,也可以参考网上资源说明,没什么难点。

  (3)安装cudnn的命令

  tar-xzvf cudnn-10.0-linux-x64-v7.4.1.5.tgz

  上述命令是解压命令,解压完了以后要拷贝到相应的cuda目录中去,可以用linux命令,也可以用xftp,这个上网查一下就好。

  Linux拷贝命令举例:

  cp/data/users/CHDHPC/lwmnpop/cudnn/include/cudnn.h/data/users/CHDHPC/lwmnpop/cuda-10.0 /include/

  cp/data/users/CHDHPC/lwmnpop/cudnn /lib64/libcudnn*/data/users/CHDHPC/lwmnpop/cuda-10.0/lib64

  chmoda+r /data/users/CHDHPC/lwmnpop/cudnn /include/cudnn.h/data/users/CHDHPC/lwmnpop/cuda-10.0/lib64/libcudnn*

  命令格式:cp原文件目标文件

  命令中间是有空格的。

  这三个命令都要执行,执行前把我的目录换成你的目录就行了,就是那个lwmnpop。Cudnn的解压目录一定要是cudnn,Cuda的安装目录一定要是cuda-10.0,如果不是,换成你自己的。

  注意:安装完成后,修改bashrc文件,这个是个隐藏文件,需要打开xftp设置里的显示隐藏文件才能看见,这样才能在xftp下进行编辑,当然,如果用命令直接编辑,就无所谓了。Xftp编辑完了以后,可以重启xshell,就不用执行source~/.bashrc命令了,它会重新加载环境变量。

  这是命令编辑方式:

  nano~/.bashrc

  #进入后在最后两行加入以下内容

  exportPATH=$HOME /data/users/CHDHPC/lwmnpop/cuda-10.0/bin:$PATH

  exportLD_LIBRARY_PATH=$LD_LIBRARY_PATH:$HOME/data/users/CHDHPC/lwmnpop/cuda-10.0/lib64/

  #修改之后使环境变量生效

  source~/.bashrc

  (4)安装pytorch的命令

  condainstall --offlinepytorch-1.6.0-py3.8_cuda10.1.243_cudnn7.6.3_0.tar.bz2

  (5)安装torchvision的命令

  condainstall --offline torchvision-0.9.0-py38_cu101.tar.bz2

  (6)安装cudatoolkit的命令

  condainstall --offline cudatoolkit-10.1.243-h6bb024c_0.tar.bz2