Verstärkungslernen

Aus Versuch und Irrtum lernen – Roboter, die ihr Verhalten anhand von Belohnungssignalen optimieren.

Was ist Reinforcement Learning?

Reinforcement Learning (RL) ist ein Paradigma, bei dem ein Agent lernt, die kumulative Belohnung durch Interaktion mit einer Umgebung zu maximieren. Der Agent ergreift Maßnahmen, erhält Belohnungen (oder Strafen) und aktualisiert seine Richtlinien, um sie im Laufe der Zeit zu verbessern.

Schlüsselkonzepte

Belohnungssignal — Spärliches oder dichtes Feedback, das den Fortschritt der Aufgabe anzeigt (z. B. Objekt ergriffen, Ziel erreicht).
Politisch — Zuordnung von Beobachtungen zu Aktionen. Häufig neuronale Netze (z. B. PPO, SAC).
Sim-to-Real — Trainieren Sie in Simulationen und setzen Sie sie an echten Robotern ein. Die Domain-Randomisierung hilft, diese Lücke zu schließen.

Verstärkungslernen

Was ist Reinforcement Learning?

Schlüsselkonzepte

Verwandte Ressourcen