现实差距
在模拟中取得 95% 成功率的政策在现实世界中通常会下降到 30-50%。 这种“现实差距”源于视觉差异(渲染与真实图像)、物理差异(接触模型不准确)和传感器噪声模式。 系统地弥合这一差距是机器人学习中最重要的实用技能之一。
三大策略
域随机化:跨宽参数分布进行训练,因此现实世界“只是另一个样本”。 系统识别:仔细测量和校准模拟参数以匹配现实。 微调:进行模拟训练,然后收集一个小型现实世界数据集(50-200 集)并进行微调。 大多数成功的部署都结合了这三者。
- 域随机化:最适合视觉策略
- 系统识别:最适合接触丰富的任务
- 现实世界的微调:几乎总是能提高性能
- 推荐:将三者结合起来
实用技巧
从 MuJoCo 或 Isaac Sim 开始(两者都有良好的接触模型)。 积极随机化相机位置、照明和对象纹理。 测量真实的关节摩擦力和阻尼。 在尝试复杂任务之前先验证简单任务的模拟到真实。 SVRC 为 OpenArm 提供校准的仿真模型。