Soma Zero Tutorials
🔍 搜索功能尚未开启,敬请期待。

1.3 其他环境

本节目标:训练主环境(Isaac Lab)之外,项目还会用到一些配套环境与工具。这里先把它们登记清楚、说明"何时才需要装",避免一开始就把摊子铺太大。原则:用到再装

1. MuJoCo(sim2sim 迁移的目标环境)★

MuJoCo 是另一个开源物理引擎(DeepMind 维护)。它在本项目里只有一个用途,却是最值钱的一个——sim2sim 验证

  • 把 Isaac Lab 训出来的策略(policy.onnx原封不动放到 MuJoCo 里跑,换一个物理引擎看它还走不走得稳。
  • 这能检验策略有没有"过拟合"到 Isaac 的特定物理;我们没有真机,sim2sim 就是 sim2real 的代理
  • 用社区的 G1 模型:mujoco_menagerie 里的 G1 MJCF。

何时装:M3(sim2sim)阶段才装,现在不必。对应 附录待办 的「阶 4」。

2. 训练辅助工具

工具作用何时用
TensorBoard看训练曲线(奖励、回合时长、各 reward 项)判断收敛。每次训练(随 Isaac Lab 自带)
ONNX Runtime策略导出成 policy.onnx 后,做跨框架/跨引擎的可部署推理。导出与 sim2sim 部署时
mujoco_menagerie提供 G1 的 MJCF 模型文件(关节、连杆、惯量)。M3 与 MuJoCo 一起

3. 暂不需要、但路线上可能延伸

  • 真机部署环境(Unitree SDK 等)—— 本项目以仿真为主,没有真机,不在当前范围。
  • 其他仿真器(如 Genesis / PyBullet)—— 如果后续要做更广的迁移对比再说,目前一个 MuJoCo 足够证明方法论。

把这些"可能用到"的环境登记在这里,是为了路线清晰;当前阶段只需 1.1 / 1.2 的 Isaac Lab 训练环境就能开工

👉 下一节:1.4 官方示例——把 Isaac Lab 自带的 G1 任务逐层吃透。