1.3 其他环境
本节目标:训练主环境(Isaac Lab)之外,项目还会用到一些配套环境与工具。这里先把它们登记清楚、说明"何时才需要装",避免一开始就把摊子铺太大。原则:用到再装。
1. MuJoCo(sim2sim 迁移的目标环境)★
MuJoCo 是另一个开源物理引擎(DeepMind 维护)。它在本项目里只有一个用途,却是最值钱的一个——sim2sim 验证:
- 把 Isaac Lab 训出来的策略(
policy.onnx)原封不动放到 MuJoCo 里跑,换一个物理引擎看它还走不走得稳。 - 这能检验策略有没有"过拟合"到 Isaac 的特定物理;我们没有真机,sim2sim 就是 sim2real 的代理。
- 用社区的 G1 模型:
mujoco_menagerie里的 G1 MJCF。
何时装:M3(sim2sim)阶段才装,现在不必。对应 附录待办 的「阶 4」。
2. 训练辅助工具
| 工具 | 作用 | 何时用 |
|---|---|---|
| TensorBoard | 看训练曲线(奖励、回合时长、各 reward 项)判断收敛。 | 每次训练(随 Isaac Lab 自带) |
| ONNX Runtime | 策略导出成 policy.onnx 后,做跨框架/跨引擎的可部署推理。 | 导出与 sim2sim 部署时 |
| mujoco_menagerie | 提供 G1 的 MJCF 模型文件(关节、连杆、惯量)。 | M3 与 MuJoCo 一起 |
3. 暂不需要、但路线上可能延伸
- 真机部署环境(Unitree SDK 等)—— 本项目以仿真为主,没有真机,不在当前范围。
- 其他仿真器(如 Genesis / PyBullet)—— 如果后续要做更广的迁移对比再说,目前一个 MuJoCo 足够证明方法论。
把这些"可能用到"的环境登记在这里,是为了路线清晰;当前阶段只需 1.1 / 1.2 的 Isaac Lab 训练环境就能开工。
👉 下一节:1.4 官方示例——把 Isaac Lab 自带的 G1 任务逐层吃透。