Politisches Lernen

Beobachtungen auf Aktionen abbilden – visuomotorische Richtlinien für die Robotersteuerung.

Was ist Policy Learning?

Eine Richtlinie ist eine Funktion, die Beobachtungen (Bilder, Zustand) auf Aktionen (gemeinsame Befehle, Greifer) abbildet. Policy Learning trainiert diese Zuordnung anhand von Daten (Nachahmung) oder Belohnung (RL). Visuomotorische Richtlinien nutzen das Sehvermögen als primären Input.

Schlüsselarchitekturen

ACT (Action Chunking mit Transformers) – Prognostiziert Aktionsblöcke; reibungslose Abwicklung.
Verbreitungspolitik — Entrauschungsdiffusion für multimodale Aktionsverteilungen.
Verhaltensklonen — Einfaches überwachtes Lernen anhand von Demos.
VLA — Vision-Sprach-Aktionsmodelle (OpenVLA, RT-2) mit Sprachkonditionierung.

Politisches Lernen

Was ist Policy Learning?

Schlüsselarchitekturen

Verwandte Ressourcen