rl_sar/README_CN.md

# rl_sar

[English document](README.md)

本仓库提供了机器人强化学习算法的仿真验证与实物部署框架，适配四足机器人、轮足机器人、人形机器人。"sar"代表"simulation and real"

特性：
- 支持基于IaacGym的legged_gym，也支持基于IsaacSim的IsaacLab，用`framework`加以区分。
- 代码有python和cpp两个版本，python版本可以在`src/rl_sar/scripts`中找到

[点击在Discord上讨论](https://discord.gg/MC9KguQHtt)

## 准备

拉取代码

```bash
git clone https://github.com/fan-ziqi/rl_sar.git
```

## 依赖

本项目使用`ros-noetic`(Ubuntu20.04)，且需要安装以下的ros依赖包

```bash
sudo apt install ros-noetic-teleop-twist-keyboard ros-noetic-controller-interface ros-noetic-gazebo-ros-control ros-noetic-joint-state-controller ros-noetic-effort-controllers ros-noetic-joint-trajectory-controller
```

在任意位置下载并部署`libtorch`

```bash
cd /path/to/your/torchlib
wget https://download.pytorch.org/libtorch/cpu/libtorch-cxx11-abi-shared-with-deps-2.0.1%2Bcpu.zip
unzip libtorch-cxx11-abi-shared-with-deps-2.0.1+cpu.zip -d ./
echo 'export Torch_DIR=/path/to/your/torchlib' >> ~/.bashrc
```

安装`yaml-cpp`和`lcm`，若您使用Ubuntu，可以直接使用包管理器进行安装

```bash
sudo apt install liblcm-dev libyaml-cpp-dev
```

<details>

<summary>也可以使用源码安装，点击展开</summary>

安装yaml-cpp

```bash
git clone https://github.com/jbeder/yaml-cpp.git
cd yaml-cpp && mkdir build && cd build
cmake -DYAML_BUILD_SHARED_LIBS=on .. && make
sudo make install
sudo ldconfig
```

安装lcm

```bash
git clone https://github.com/lcm-proj/lcm.git
cd lcm && mkdir build && cd build
cmake .. && make
sudo make install
sudo ldconfig
```
</details>

## 编译

在项目根目录编译

```bash
cd ..
catkin build
```

如果 catkin build 报错: `Unable to find either executable 'empy' or Python module 'em'`, 在`catkin build` 之前执行 `catkin config -DPYTHON_EXECUTABLE=/usr/bin/python3`

## 运行

运行前请将训练好的pt模型文件拷贝到`rl_sar/src/rl_sar/models/YOUR_ROBOT_NAME`中，并配置`config.yaml`中的参数。

### 仿真

打开一个终端，启动gazebo仿真环境

```bash
source devel/setup.bash
roslaunch rl_sar gazebo_<ROBOT>.launch
```

打开一个新终端，启动控制程序

```bash
source devel/setup.bash
(for cpp version)    rosrun rl_sar rl_sim
(for python version) rosrun rl_sar rl_sim.py
```

其中 \<ROBOT\> 可以是 `a1` 或 `a1_isaaclab` 或 `gr1t1` 或 `gr1t2`.

控制：

* 按 **\<Enter\>** 切换仿真器运行/停止。
* **W** 和 **S** 控制x轴，**A** 和 **D** 控制yaw轴，**J** 和 **L** 控制y轴，按下空格重置控制指令。
* 按 **\<Space\>** 将所有控制指令设置为零。
* 如果机器人摔倒，按 **R** 重置Gazebo环境。

### 真实机器人

**示例：Unitree A1**

与Unitree A1连接可以使用无线与有线两种方式

* 无线：连接机器人发出的Unitree开头的WIFI **（注意：无线连接可能会出现丢包断联甚至失控，请注意安全）**
* 有线：用网线连接计算机和机器人的任意网口，配置计算机ip为192.168.123.162，网关255.255.255.0

新建终端，启动控制程序

```bash
source devel/setup.bash
rosrun rl_sar rl_real_a1
```

按下遥控器的**R2**键让机器人切换到默认站起姿态，按下**R1**键切换到RL控制模式，任意状态按下**L2**切换到最初的趴下姿态。左摇杆上下控制x左右控制yaw，右摇杆左右控制y。

或者按下键盘上的**0**键让机器人切换到默认站起姿态，按下**P**键切换到RL控制模式，任意状态按下**1**键切换到最初的趴下姿态。WS控制x，AD控制yaw，JL控制y。

### 训练执行器网络

1. 取消注释`rl_real.cpp`中最上面的`#define CSV_LOGGER`，你也可以在仿真程序中修改对应部分采集仿真数据用来测试训练过程。
2. 运行控制程序，程序会在执行后记录所有数据。
3. 停止控制程序，开始训练执行器网络。注意，下面的路径前均省略了`rl_sar/src/rl_sar/models/`。
    ```bash
    rosrun rl_sar actuator_net.py --mode train --data a1/motor.csv --output a1/motor.pt
    ```
4. 验证已经训练好的训练执行器网络。
    ```bash
    rosrun rl_sar actuator_net.py --mode play --data a1/motor.csv --output a1/motor.pt
    ```

## 添加你的机器人

下文中将`<ROBOT>`代表机器人名称

1. 在`rl_sar/src/robots`路径下创建名为`<ROBOT>_description`的模型包，将模型的urdf放到`rl_sar/src/robots/<ROBOT>_description/urdf`路径下并命名为`<ROBOT>.urdf`，并在`rl_sar/src/robots/<ROBOT>_description/config`路径下创建命名空间为`<ROBOT>_gazebo`的关节配置文件
2. 将训练好的RL模型文件放到`rl_sar/src/rl_sar/models/<ROBOT>`路径下
3. 在`rl_sar/src/rl_sar/models/<ROBOT>`中新建config.yaml文件，参考`rl_sar/src/rl_sar/models/a1_isaacgym/config.yaml`文件修改其中参数
4. 按需修改代码中的`forward()`函数，以适配不同的模型
5. 若需要运行仿真，则参考`rl_sar/src/rl_sar/launch`路径下的launch文件自行修改
6. 若需要运行实物，则参考`rl_sar/src/rl_sar/src/rl_real_a1.cpp`文件自行修改

## 参考

[unitree_ros](https://github.com/unitreerobotics/unitree_ros)

## 引用

如果您使用此代码或其部分内容，请引用以下内容：

```
@software{fan-ziqi2024rl_sar,
  author = {fan-ziqi},
  title = {{rl_sar: Simulation Verification and Physical Deployment of Robot Reinforcement Learning Algorithm.}},
  url = {https://github.com/fan-ziqi/rl_sar},
  year = {2024}
}
```
-												docs: update readme_cn

											
										
										
											2024-03-14 11:36:49 +08:00
+								# rl_sar
-												translate

											
										
										
											2024-03-07 11:54:33 +08:00
 								[English document](README.md)
-												docs: simplified readme dependency installation #24

											
										
										
											2024-10-08 18:01:52 +08:00
+								本仓库提供了机器人强化学习算法的仿真验证与实物部署框架，适配四足机器人、轮足机器人、人形机器人。"sar"代表"simulation and real"
-												docs: update readme_cn

											
										
										
											2024-03-14 11:36:49 +08:00
-												docs: simplified readme dependency installation #24

											
										
										
											2024-10-08 18:01:52 +08:00
+								特性：
 								- 支持基于IaacGym的legged_gym，也支持基于IsaacSim的IsaacLab，用`framework`加以区分。
 								- 代码有python和cpp两个版本，python版本可以在`src/rl_sar/scripts`中找到
-												feat: isaaclab framework support


											
										
										
											2024-08-09 17:55:01 +08:00
-												feat: add Discord

											
										
										
											2024-06-01 11:57:49 +08:00
+								[点击在Discord上讨论](https://discord.gg/MC9KguQHtt)
-												translate

											
										
										
											2024-03-07 11:54:33 +08:00
+								## 准备
-												feat: [Destructive Update]del submodules unitree_ros

											
										
										
											2024-05-23 20:55:35 +08:00
+								拉取代码
-												translate

											
										
										
											2024-03-07 11:54:33 +08:00
 								```bash
-												feat: [Destructive Update]del submodules unitree_ros

											
										
										
											2024-05-23 20:55:35 +08:00
+								git clone https://github.com/fan-ziqi/rl_sar.git
-												translate

											
										
										
											2024-03-07 11:54:33 +08:00
+								```
-												docs: yaml

											
										
										
											2024-04-05 22:03:00 +08:00
+								## 依赖
-												docs: simplified readme dependency installation #24

											
										
										
											2024-10-08 18:01:52 +08:00
+								本项目使用`ros-noetic`(Ubuntu20.04)，且需要安装以下的ros依赖包
-												docs: update readme

											
										
										
											2024-05-25 08:54:13 +08:00
 								```bash
-												docs: simplified readme dependency installation #24

											
										
										
											2024-10-08 18:01:52 +08:00
+								sudo apt install ros-noetic-teleop-twist-keyboard ros-noetic-controller-interface ros-noetic-gazebo-ros-control ros-noetic-joint-state-controller ros-noetic-effort-controllers ros-noetic-joint-trajectory-controller
-												docs: update readme

											
										
										
											2024-05-25 08:54:13 +08:00
+								```
-												translate

											
										
										
											2024-03-07 11:54:33 +08:00
+								在任意位置下载并部署`libtorch`
 								```bash
 								cd /path/to/your/torchlib
 								wget https://download.pytorch.org/libtorch/cpu/libtorch-cxx11-abi-shared-with-deps-2.0.1%2Bcpu.zip
 								unzip libtorch-cxx11-abi-shared-with-deps-2.0.1+cpu.zip -d ./
 								echo 'export Torch_DIR=/path/to/your/torchlib' >> ~/.bashrc
 								```
-												docs: simplified readme dependency installation #24

											
										
										
											2024-10-08 18:01:52 +08:00
+								安装`yaml-cpp`和`lcm`，若您使用Ubuntu，可以直接使用包管理器进行安装
 								```bash
 								sudo apt install liblcm-dev libyaml-cpp-dev
 								```
 								<details>
 								<summary>也可以使用源码安装，点击展开</summary>
-												feat: yaml-cpp

											
										
										
											2024-04-05 21:37:25 +08:00
+								安装yaml-cpp
 								```bash
 								git clone https://github.com/jbeder/yaml-cpp.git
 								cd yaml-cpp && mkdir build && cd build
 								cmake -DYAML_BUILD_SHARED_LIBS=on .. && make
 								sudo make install
 								sudo ldconfig
 								```
-												fix: build bugs

											
										
										
											2024-04-17 15:20:19 +08:00
+								安装lcm
 								```bash
-												docs: simplified readme dependency installation #24

											
										
										
											2024-10-08 18:01:52 +08:00
+								git clone https://github.com/lcm-proj/lcm.git
-												fix: build bugs

											
										
										
											2024-04-17 15:20:19 +08:00
+								cd lcm && mkdir build && cd build
 								cmake .. && make
 								sudo make install
 								sudo ldconfig
 								```
-												docs: simplified readme dependency installation #24

											
										
										
											2024-10-08 18:01:52 +08:00
+								</details>
-												fix: build bugs

											
										
										
											2024-04-17 15:20:19 +08:00
-												translate

											
										
										
											2024-03-07 11:54:33 +08:00
+								## 编译
-												feat: add obs list in config.yaml and move ComputeObservation to rl_sdk

											
										
										
											2024-08-16 11:44:00 +08:00
+								在项目根目录编译
-												translate

											
										
										
											2024-03-07 11:54:33 +08:00
 								```bash
 								cd ..
 								catkin build
 								```
-												feat: [Breaking change] split config.yaml into separate model folders

											
										
										
											2024-08-15 23:14:48 +08:00
+								如果 catkin build 报错: `Unable to find either executable 'empy' or Python module 'em'`, 在`catkin build` 之前执行 `catkin config -DPYTHON_EXECUTABLE=/usr/bin/python3`
-												translate

											
										
										
											2024-03-07 11:54:33 +08:00
+								## 运行
-												docs: yaml

											
										
										
											2024-04-05 22:03:00 +08:00
+								运行前请将训练好的pt模型文件拷贝到`rl_sar/src/rl_sar/models/YOUR_ROBOT_NAME`中，并配置`config.yaml`中的参数。
-												docs: update readme_cn

											
										
										
											2024-03-14 11:36:49 +08:00
 								### 仿真
-												translate

											
										
										
											2024-03-07 11:54:33 +08:00
-												feat: add RL python sdk

											
										
										
											2024-06-29 11:38:07 +08:00
+								打开一个终端，启动gazebo仿真环境
-												translate

											
										
										
											2024-03-07 11:54:33 +08:00
 								```bash
 								source devel/setup.bash
-												docs: update gr1t1

											
										
										
											2024-05-25 17:39:22 +08:00
+								roslaunch rl_sar gazebo_<ROBOT>.launch
-												translate

											
										
										
											2024-03-07 11:54:33 +08:00
+								```
-												feat: add RL python sdk

											
										
										
											2024-06-29 11:38:07 +08:00
+								打开一个新终端，启动控制程序
 								```bash
 								source devel/setup.bash
 								(for cpp version)    rosrun rl_sar rl_sim
 								(for python version) rosrun rl_sar rl_sim.py
 								```
-												feat: isaaclab framework support


											
										
										
											2024-08-09 17:55:01 +08:00
+								其中 \<ROBOT\> 可以是 `a1` 或 `a1_isaaclab` 或 `gr1t1` 或 `gr1t2`.
-												docs: update gr1t1

											
										
										
											2024-05-25 17:39:22 +08:00
-												feat: change interaction logic

											
										
										
											2024-06-12 16:01:17 +08:00
+								控制：
-												translate

											
										
										
											2024-03-07 11:54:33 +08:00
-												feat: change interaction logic

											
										
										
											2024-06-12 16:01:17 +08:00
+								* 按 **\<Enter\>** 切换仿真器运行/停止。
 								* **W** 和 **S** 控制x轴，**A** 和 **D** 控制yaw轴，**J** 和 **L** 控制y轴，按下空格重置控制指令。
 								* 按 **\<Space\>** 将所有控制指令设置为零。
 								* 如果机器人摔倒，按 **R** 重置Gazebo环境。
-												docs: add R

											
										
										
											2024-05-25 17:55:57 +08:00
-												feat: [Breaking change] split config.yaml into separate model folders

											
										
										
											2024-08-15 23:14:48 +08:00
+								### 真实机器人
-												translate

											
										
										
											2024-03-07 11:54:33 +08:00
-												feat: [Breaking change] split config.yaml into separate model folders

											
										
										
											2024-08-15 23:14:48 +08:00
+								**示例：Unitree A1**
-												feat: add cyberdog

											
										
										
											2024-03-29 19:36:58 +08:00
-												docs: add cyberdog deploment

											
										
										
											2024-04-08 23:25:05 +08:00
+								与Unitree A1连接可以使用无线与有线两种方式
-												docs: add physical deploment

											
										
										
											2024-03-18 14:53:31 +08:00
 								* 无线：连接机器人发出的Unitree开头的WIFI **（注意：无线连接可能会出现丢包断联甚至失控，请注意安全）**
 								* 有线：用网线连接计算机和机器人的任意网口，配置计算机ip为192.168.123.162，网关255.255.255.0
-												docs: update readme_cn

											
										
										
											2024-03-14 11:36:49 +08:00
+								新建终端，启动控制程序
-												translate

											
										
										
											2024-03-07 11:54:33 +08:00
-												docs: update readme_cn

											
										
										
											2024-03-14 11:36:49 +08:00
+								```bash
 								source devel/setup.bash
-												docs: add cyberdog deploment

											
										
										
											2024-04-08 23:25:05 +08:00
+								rosrun rl_sar rl_real_a1
-												docs: update readme_cn

											
										
										
											2024-03-14 11:36:49 +08:00
+								```
-												add sim2real

											
										
										
											2024-03-14 00:18:32 +08:00
-												docs: add physical deploment

											
										
										
											2024-03-18 14:53:31 +08:00
+								按下遥控器的**R2**键让机器人切换到默认站起姿态，按下**R1**键切换到RL控制模式，任意状态按下**L2**切换到最初的趴下姿态。左摇杆上下控制x左右控制yaw，右摇杆左右控制y。
-												docs: add Citation

											
										
										
											2024-03-22 00:16:13 +08:00
-												feat: add actuator trainer

											
										
										
											2024-07-28 22:03:10 +08:00
+								或者按下键盘上的**0**键让机器人切换到默认站起姿态，按下**P**键切换到RL控制模式，任意状态按下**1**键切换到最初的趴下姿态。WS控制x，AD控制yaw，JL控制y。
 								### 训练执行器网络
 . 取消注释`rl_real.cpp`中最上面的`#define CSV_LOGGER`，你也可以在仿真程序中修改对应部分采集仿真数据用来测试训练过程。
 . 运行控制程序，程序会在执行后记录所有数据。
 . 停止控制程序，开始训练执行器网络。注意，下面的路径前均省略了`rl_sar/src/rl_sar/models/`。
 								    ```bash
 								    rosrun rl_sar actuator_net.py --mode train --data a1/motor.csv --output a1/motor.pt
 								    ```
 . 验证已经训练好的训练执行器网络。
 								    ```bash
 								    rosrun rl_sar actuator_net.py --mode play --data a1/motor.csv --output a1/motor.pt
 								    ```
-												feat: add cyberdog

											
										
										
											2024-03-29 19:36:58 +08:00
-												feat:
* add joint_names to config.yaml
* add ReadTensorFromYaml
* Due to the fact that the robot_state_publisher sorts the joint names alphabetically the mapping table is established according to the order defined in the YAML file

											
										
										
											2024-04-28 16:51:46 +08:00
+								## 添加你的机器人
-												feat: [Breaking change] split config.yaml into separate model folders

											
										
										
											2024-08-15 23:14:48 +08:00
+								下文中将`<ROBOT>`代表机器人名称
-												feat:
* add joint_names to config.yaml
* add ReadTensorFromYaml
* Due to the fact that the robot_state_publisher sorts the joint names alphabetically the mapping table is established according to the order defined in the YAML file

											
										
										
											2024-04-28 16:51:46 +08:00
-												feat: [Breaking change] split config.yaml into separate model folders

											
										
										
											2024-08-15 23:14:48 +08:00
+. 在`rl_sar/src/robots`路径下创建名为`<ROBOT>_description`的模型包，将模型的urdf放到`rl_sar/src/robots/<ROBOT>_description/urdf`路径下并命名为`<ROBOT>.urdf`，并在`rl_sar/src/robots/<ROBOT>_description/config`路径下创建命名空间为`<ROBOT>_gazebo`的关节配置文件
 . 将训练好的RL模型文件放到`rl_sar/src/rl_sar/models/<ROBOT>`路径下
 . 在`rl_sar/src/rl_sar/models/<ROBOT>`中新建config.yaml文件，参考`rl_sar/src/rl_sar/models/a1_isaacgym/config.yaml`文件修改其中参数
-												feat: add obs list in config.yaml and move ComputeObservation to rl_sdk

											
										
										
											2024-08-16 11:44:00 +08:00
+. 按需修改代码中的`forward()`函数，以适配不同的模型
 . 若需要运行仿真，则参考`rl_sar/src/rl_sar/launch`路径下的launch文件自行修改
 . 若需要运行实物，则参考`rl_sar/src/rl_sar/src/rl_real_a1.cpp`文件自行修改
-												feat: [Destructive Update]del submodules unitree_ros

											
										
										
											2024-05-23 20:55:35 +08:00
 								## 参考
 								[unitree_ros](https://github.com/unitreerobotics/unitree_ros)
-												feat:
* add joint_names to config.yaml
* add ReadTensorFromYaml
* Due to the fact that the robot_state_publisher sorts the joint names alphabetically the mapping table is established according to the order defined in the YAML file

											
										
										
											2024-04-28 16:51:46 +08:00
-												docs: add Citation

											
										
										
											2024-03-22 00:16:13 +08:00
+								## 引用
 								如果您使用此代码或其部分内容，请引用以下内容：
 								```
 								@software{fan-ziqi2024rl_sar,
 								  author = {fan-ziqi},
-												docs: update readme

											
										
										
											2024-05-25 08:54:13 +08:00
+								  title = {{rl_sar: Simulation Verification and Physical Deployment of Robot Reinforcement Learning Algorithm.}},
-												docs: add Citation

											
										
										
											2024-03-22 00:16:13 +08:00
+								  url = {https://github.com/fan-ziqi/rl_sar},
 								  year = {2024}
 								}
 								```