远程服务器复现fast-reid

2022-07-28,,,

1.下载Xshell,远程连接服务器

打开Xshell,点击“文件”,“新建”。如下界面:

名称改不改都行,在主机位置输入主机号。点击“用户身份验证”,输入用户名和密码,点击“确认”。然后在首页再次点击“文件”、“连接”。选择刚刚创建的会话,进行连接。
服务器连接成功。

2.配置fast-reid的环境
2.1创建虚拟环境

conda create --name fastreid python==3.8

2.2激活虚拟环境

conda activate fastreid

2.3安装pytorch

conda install pytorch==1.6.0 torchvision tensorboard -c pytorch

2.4安装依赖

cd fast-reid-master
pip install -r ./requirements.txt

其中requirements.txt内容:

第一次在跑实验的时候直接按照Githup上的要求一个一个安装的,比较麻烦。之后看师哥在用公司服务器配置环境的时候直接用requirements.txt,真的快多了!

2.5编译加速评估测试

cd fast-reid-master/fastreid/evaluation/rank_cylib;make all

3在虚拟环境中,输入命令行,运行程序。
在fast-reid-master的tools下,输入:

python train_net.py --config-file /home/ry/fast-reid-master/configs/Market1501/bagtricks_R50.yml --num-gpus 4

这个要根据自己的目录修改。

遇到问题:权限不够

输入 sudo -i和密码后,前面变成了(root),这样又进不了虚拟环境fastreid中,按Ctrl+D退出,输入conda activate fastreid,然后到tools目录下,输入:

python train_net.py --config-file /home/ry/fast-reid-master/configs/Market1501/bagtricks_R50.yml --num-gpus 4。

程序运行了一会后报错。

遇到问题:找不到~/.cache/torch/checkpoints/resnet50-19c8e357.pth。
在进入/home/ry后,输入ls,没有看到cache,但是通过输入cd .cache可以进入该目录下,发现checkpoints的上级目录是hnu,而hnu的上级目录才是torch。即:~/.cache/torch/hnu/checkpoints/resnet50-19c8e357.pth。

解决办法是将checkpoints移到上一级。

操作过程:
开始移错了,进入checkpoints目录下后,输入mv *../,结果把resnet50-19c8e357.pth移到了上级目录,与checkpoints同级目录。然后cd .. 回到hnu目录下后,输入mv *../把checkpoints和resnet50-19c8e357.pth都移动到了与hnu同级目录。进入checkpoints目录下,输入:
cp /home/ry/.cache/torch/resnet50-19c8e357.pth .

再次输入运行命令,程序运行成功~~~~

或4.自己电脑的pycharm中选择服务器中配置好环境下的解释器
把fast-reid-master导入自己电脑的pycharm后,选择setting,然后选择解释器。

点击“SSH Interpreter”后,在Host输入服务器ip。然后解释器选择home/ry/.conda/env/fastreid/bin/python 3.8,然后要改一下mapping,使得自己电脑上的fast-reid-master映射上服务器上的fast-reid-master。选/home/ry/fast-reid-master。保存后,自动更新。然后运行程序。

巩固:
1.移动目录到上一级
/a/b
要把b移到与a同级,cd a,再输入mv *../(两个点)

2.复制文件或目录到该目录下
a目录下有b和c,把c复制到b目录下
cd /a/b,再输入:cp ./c .。(中间空两格,再打个点)

本文地址:https://blog.csdn.net/xuranyi/article/details/109627723

《远程服务器复现fast-reid.doc》

下载本文的Word格式文档,以方便收藏与打印。