模仿学习
从演示中学习——机器人通过远程操作数据复制人类行为。
什么是模仿学习?
模仿学习(IL)是机器人通过观察和复制专家演示来学习执行任务的范例。 机器人不是从奖励信号中学习(如强化学习中那样),而是从人类远程操作或动觉教学期间收集的状态动作对中学习。
主要方法
- 行为克隆(BC) ——(观察、行动)对的监督学习。 简单但容易发生分布转移。
- 匕首 — 迭代数据收集:运行策略、获得专家修正、重新训练。 减少分配偏移。
- 逆强化学习(IRL) — 从演示中推断奖励函数,然后优化策略。
从演示中学习——机器人通过远程操作数据复制人类行为。
模仿学习(IL)是机器人通过观察和复制专家演示来学习执行任务的范例。 机器人不是从奖励信号中学习(如强化学习中那样),而是从人类远程操作或动觉教学期间收集的状态动作对中学习。