rl_sar/README_CN.md

5.3 KiB
Raw Blame History

rl_sar

English document

机器人强化学习算法的仿真验证与实物部署,适配四足机器人、轮足机器人、人形机器人。"sar"代表"simulation and real"

本框架支持基于IaacGym的legged_gym也支持基于IsaacSim的IsaacLabframework加以区分。

点击在Discord上讨论

准备

拉取代码

git clone https://github.com/fan-ziqi/rl_sar.git

依赖

本项目依赖ROS-Noetic(Ubuntu20.04)

安装好ros之后安装依赖库

sudo apt install ros-noetic-teleop-twist-keyboard ros-noetic-controller-interface  ros-noetic-gazebo-ros-control ros-noetic-joint-state-controller ros-noetic-effort-controllers ros-noetic-joint-trajectory-controller

在任意位置下载并部署libtorch

cd /path/to/your/torchlib
wget https://download.pytorch.org/libtorch/cpu/libtorch-cxx11-abi-shared-with-deps-2.0.1%2Bcpu.zip
unzip libtorch-cxx11-abi-shared-with-deps-2.0.1+cpu.zip -d ./
echo 'export Torch_DIR=/path/to/your/torchlib' >> ~/.bashrc

安装yaml-cpp

git clone https://github.com/jbeder/yaml-cpp.git
cd yaml-cpp && mkdir build && cd build
cmake -DYAML_BUILD_SHARED_LIBS=on .. && make
sudo make install
sudo ldconfig

安装lcm

git clone https://github.com/lcm-proj/lcm.git 
cd lcm && mkdir build && cd build
cmake .. && make
sudo make install
sudo ldconfig

编译

自定义代码中的以下两个函数,以适配不同的模型:

torch::Tensor forward() override;
torch::Tensor compute_observation() override;

然后到根目录编译

cd ..
catkin build

如果 catkin build 报错: Unable to find either executable 'empy' or Python module 'em', 在catkin build 之前执行 catkin config -DPYTHON_EXECUTABLE=/usr/bin/python3

运行

运行前请将训练好的pt模型文件拷贝到rl_sar/src/rl_sar/models/YOUR_ROBOT_NAME中,并配置config.yaml中的参数。

仿真

打开一个终端启动gazebo仿真环境

source devel/setup.bash
roslaunch rl_sar gazebo_<ROBOT>.launch

打开一个新终端,启动控制程序

source devel/setup.bash
(for cpp version)    rosrun rl_sar rl_sim
(for python version) rosrun rl_sar rl_sim.py

其中 <ROBOT> 可以是 a1a1_isaaclabgr1t1gr1t2.

控制:

  • <Enter> 切换仿真器运行/停止。
  • WS 控制x轴AD 控制yaw轴JL 控制y轴按下空格重置控制指令。
  • <Space> 将所有控制指令设置为零。
  • 如果机器人摔倒,按 R 重置Gazebo环境。

真实机器人

示例Unitree A1

与Unitree A1连接可以使用无线与有线两种方式

  • 无线连接机器人发出的Unitree开头的WIFI (注意:无线连接可能会出现丢包断联甚至失控,请注意安全)
  • 有线用网线连接计算机和机器人的任意网口配置计算机ip为192.168.123.162网关255.255.255.0

新建终端,启动控制程序

source devel/setup.bash
rosrun rl_sar rl_real_a1

按下遥控器的R2键让机器人切换到默认站起姿态,按下R1键切换到RL控制模式任意状态按下L2切换到最初的趴下姿态。左摇杆上下控制x左右控制yaw右摇杆左右控制y。

或者按下键盘上的0键让机器人切换到默认站起姿态,按下P键切换到RL控制模式任意状态按下1键切换到最初的趴下姿态。WS控制xAD控制yawJL控制y。

训练执行器网络

  1. 取消注释rl_real.cpp中最上面的#define CSV_LOGGER,你也可以在仿真程序中修改对应部分采集仿真数据用来测试训练过程。
  2. 运行控制程序,程序会在执行后记录所有数据。
  3. 停止控制程序,开始训练执行器网络。注意,下面的路径前均省略了rl_sar/src/rl_sar/models/
    rosrun rl_sar actuator_net.py --mode train --data a1/motor.csv --output a1/motor.pt
    
  4. 验证已经训练好的训练执行器网络。
    rosrun rl_sar actuator_net.py --mode play --data a1/motor.csv --output a1/motor.pt
    

添加你的机器人

下文中将<ROBOT>代表机器人名称

  1. rl_sar/src/robots路径下创建名为<ROBOT>_description的模型包将模型的urdf放到rl_sar/src/robots/<ROBOT>_description/urdf路径下并命名为<ROBOT>.urdf,并在rl_sar/src/robots/<ROBOT>_description/config路径下创建命名空间为<ROBOT>_gazebo的关节配置文件
  2. 将训练好的RL模型文件放到rl_sar/src/rl_sar/models/<ROBOT>路径下
  3. rl_sar/src/rl_sar/models/<ROBOT>中新建config.yaml文件参考rl_sar/src/rl_sar/models/a1_isaacgym/config.yaml文件修改其中参数
  4. 若需要运行仿真,则参考rl_sar/src/rl_sar/launch路径下的launch文件自行修改
  5. 若需要运行实物,则参考rl_sar/src/rl_sar/src/rl_real_a1.cpp文件自行修改

参考

unitree_ros

引用

如果您使用此代码或其部分内容,请引用以下内容:

@software{fan-ziqi2024rl_sar,
  author = {fan-ziqi},
  title = {{rl_sar: Simulation Verification and Physical Deployment of Robot Reinforcement Learning Algorithm.}},
  url = {https://github.com/fan-ziqi/rl_sar},
  year = {2024}
}