rl_sar/README_CN.md

2.0 KiB
Raw Blame History

rl_sar

English document

强化学习的Gazebo仿真验证与UnitreeA1实物部署。"sar"代表"simulation and real"

准备

拉取代码(同步拉取子模块)

git clone --recursive https://github.com/fan-ziqi/rl_sar.git

如有更新:

git pull
git submodule update --remote --recursive

在任意位置下载并部署libtorch

cd /path/to/your/torchlib
wget https://download.pytorch.org/libtorch/cpu/libtorch-cxx11-abi-shared-with-deps-2.0.1%2Bcpu.zip
unzip libtorch-cxx11-abi-shared-with-deps-2.0.1+cpu.zip -d ./
echo 'export Torch_DIR=/path/to/your/torchlib' >> ~/.bashrc

安装 teleop-twist-keyboard

sudo apt install ros-noetic-teleop-twist-keyboard

编译

自定义代码中的以下两个函数,以适配不同的模型:

torch::Tensor forward() override;
torch::Tensor compute_observation() override;

然后到根目录编译

cd ..
catkin build

运行

运行前请将训练好的pt模型文件拷贝到rl_sar/src/rl_sar/models

仿真

新建终端启动gazebo仿真环境

source devel/setup.bash
roslaunch rl_sar start_env.launch

新建终端,启动控制程序

source devel/setup.bash
rosrun rl_sar rl_sim

新建终端,键盘控制程序

rosrun teleop_twist_keyboard teleop_twist_keyboard.py

实物

与实物的连接可分为无线与有线形式

  • 无线连接机器人发出的Unitree开头的WIFI (注意:无线连接可能会出现丢包断联甚至失控,请注意安全)
  • 有线用网线连接计算机和机器人的任意网口配置计算机ip为192.168.123.162网关255.255.255.0

新建终端,启动控制程序

source devel/setup.bash
rosrun rl_sar rl_real

按下遥控器的R2键让机器人切换到默认站起姿态,按下R1键切换到RL控制模式任意状态按下L2切换到最初的趴下姿态。左摇杆上下控制x左右控制yaw右摇杆左右控制y。