← 术语表

模仿学习

从演示中学习——机器人通过远程操作数据复制人类行为。

什么是模仿学习?

模仿学习(IL)是机器人通过观察和复制专家演示来学习执行任务的范例。 机器人不是从奖励信号中学习(如强化学习中那样),而是从人类远程操作或动觉教学期间收集的状态动作对中学习。

主要方法

  • 行为克隆(BC) ——(观察、行动)对的监督学习。 简单但容易发生分布转移。
  • 匕首 — 迭代数据收集:运行策略、获得专家修正、重新训练。 减少分配偏移。
  • 逆强化学习(IRL) — 从演示中推断奖励函数,然后优化策略。

相关资源