Politisches Lernen
Beobachtungen auf Aktionen abbilden – visuomotorische Richtlinien für die Robotersteuerung.
Was ist Policy Learning?
Eine Richtlinie ist eine Funktion, die Beobachtungen (Bilder, Zustand) auf Aktionen (gemeinsame Befehle, Greifer) abbildet. Policy Learning trainiert diese Zuordnung anhand von Daten (Nachahmung) oder Belohnung (RL). Visuomotorische Richtlinien nutzen das Sehvermögen als primären Input.
Schlüsselarchitekturen
- ACT (Action Chunking mit Transformers) – Prognostiziert Aktionsblöcke; reibungslose Abwicklung.
- Verbreitungspolitik — Entrauschungsdiffusion für multimodale Aktionsverteilungen.
- Verhaltensklonen — Einfaches überwachtes Lernen anhand von Demos.
- VLA — Vision-Sprach-Aktionsmodelle (OpenVLA, RT-2) mit Sprachkonditionierung.
Verwandte Ressourcen
- Politikmodelle – ACT, Diffusion Policy, OpenVLA, Octo
- Nachahmungslernen
- Datendienste – Daten zur Schulung Ihrer Police