Nachahmungslernen

Aus Demonstrationen lernen – Roboter, die menschliches Verhalten anhand von Teleoperationsdaten nachbilden.

Was ist Nachahmungslernen?

Imitation Learning (IL) ist ein Paradigma, bei dem ein Roboter lernt, Aufgaben auszuführen, indem er Expertendemonstrationen beobachtet und nachahmt. Anstatt aus Belohnungssignalen zu lernen (wie beim Reinforcement Learning), lernt der Roboter aus Zustands-Aktionspaaren, die während der menschlichen Teleoperation oder des kinästhetischen Unterrichts gesammelt werden.

Schlüsselansätze

Verhaltensklonen (BC) — Überwachtes Lernen aus (Beobachtungs-, Aktions-)Paaren. Einfach, aber anfällig für Verteilungsverschiebungen.
Dolch — Iterative Datenerfassung: Richtlinien ausführen, Expertenkorrekturen einholen, neu schulen. Reduziert Verteilungsverschiebungen.
Inverses Reinforcement Learning (IRL) – Belohnungsfunktion aus Demonstrationen ableiten und dann die Richtlinie optimieren.

Nachahmungslernen

Was ist Nachahmungslernen?

Schlüsselansätze

Verwandte Ressourcen