模仿学习

从演示中学习——机器人通过远程操作数据复制人类行为。

什么是模仿学习？

模仿学习（IL）是机器人通过观察和复制专家演示来学习执行任务的范例。机器人不是从奖励信号中学习（如强化学习中那样），而是从人类远程操作或动觉教学期间收集的状态动作对中学习。

主要方法

行为克隆（BC） ——（观察、行动）对的监督学习。简单但容易发生分布转移。
匕首 — 迭代数据收集：运行策略、获得专家修正、重新训练。减少分配偏移。
逆强化学习（IRL） — 从演示中推断奖励函数，然后优化策略。

相关资源

开源数据集 — DROID、BridgeData、ALOHA、开放 X 实施例
政策模型 — ACT、扩散政策、OpenVLA、Octo
数据服务 — 我们为您的任务收集可供学习的演示