Kein Simulator. Ein kontinuierlich betriebsfähiger Aufbau in der realen Welt.
In unserem Kontext ist eine RL-Umgebung ein vollständig spezifiziertes reales Robotersystem: physischer Aufbau, klar definierte Aufgaben und Erfolgskriterien, stabile Beobachtungs- und Aktionsräume, deterministische Reset-Prozeduren, kontinuierliche Protokollierung und sichere Ausführung bei wiederholten Versuchen und Misserfolgen.
Dies gibt Teams die Möglichkeit, lernbasierte Richtlinien in der realen Welt zu trainieren, zu bewerten und zu iterieren, anstatt die Bereitstellung als den ersten echten Test zu betrachten.