Nachahmungslernen
Aus Demonstrationen lernen – Roboter, die menschliches Verhalten anhand von Teleoperationsdaten nachbilden.
Was ist Nachahmungslernen?
Imitation Learning (IL) ist ein Paradigma, bei dem ein Roboter lernt, Aufgaben auszuführen, indem er Expertendemonstrationen beobachtet und nachahmt. Anstatt aus Belohnungssignalen zu lernen (wie beim Reinforcement Learning), lernt der Roboter aus Zustands-Aktionspaaren, die während der menschlichen Teleoperation oder des kinästhetischen Unterrichts gesammelt werden.
Schlüsselansätze
- Verhaltensklonen (BC) — Überwachtes Lernen aus (Beobachtungs-, Aktions-)Paaren. Einfach, aber anfällig für Verteilungsverschiebungen.
- Dolch — Iterative Datenerfassung: Richtlinien ausführen, Expertenkorrekturen einholen, neu schulen. Reduziert Verteilungsverschiebungen.
- Inverses Reinforcement Learning (IRL) – Belohnungsfunktion aus Demonstrationen ableiten und dann die Richtlinie optimieren.
Verwandte Ressourcen
- Open-Source-Datensätze – DROID, BridgeData, ALOHA, Open X-Embodiment
- Politikmodelle – ACT, Diffusion Policy, OpenVLA, Octo
- Datendienste — Wir sammeln lernfähige Demonstrationen für Ihre Aufgaben