环境安装与依赖请参考本工程原仓库:tita_rl
本仓库强化学习部分基于:
参考环境
Environment | Brief info |
---|---|
显卡 | RTX 4090 |
CUDA | CUDA12.4 |
训练环境 | isaacgym |
sim2sim | Gazebo/Webots2023/Mujoco |
ROS | ROS2 Humble |
推理 | RTX 4090 / Jetson Orin NX + tensorRT 10.3 |
虚拟环境 | anaconda |
Press "F" to switch the perspective in the simulation interface
tita_rl_sim2sim2real 子模块 tita_rl_locomotion/diablo_pluspro_sim2real branch
conda activate tita
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/hilabldc/anaconda3/envs/tita/lib
python train.py --task=diablo_pluspro --headless
训练好的文件在tita_rl/logs下,例如tita_rl/logs/diablo_pluspro/Jul23_18-32-24_recover_stair_height_5.8, 会根据训练时的当前日期-时间排列,如果不load_run直接simple_play的话,会自动调用最近一次的log的最后一个checkpoint;当然更推荐使用--load_run来指定加载pt文件的目录
python simple_play.py --task=diablo_pluspro --load_run=/home/hilabldc/tita_rl/logs/diablo_pluspro/Jul23_18-32-24_recover_stair_height_5.8 --checkpoint=6000
将logs/<your_task_name>/exported/policies下的sim2sim.onnx推理转成model_gn.engine做sim2sim仿真
cd logs/diablo_pluspro/exported/policies
/usr/src/tensorrt/bin/trtexec --onnx=sim2sim.onnx --saveEngine=model_gn.engine
至此,iaacgym仿真和推理部分已经完成,接下来转到sim2sim和sim2real部分。
sim2sim2real参考:tita_rl_sim2sim2real