Pas un simulateur. Une configuration du monde réel opérationnelle en continu.
Dans notre contexte, un environnement RL est un système robotique réel entièrement spécifié : configuration physique, tâches et critères de réussite clairement définis, espaces d'observation et d'action stables, procédures de réinitialisation déterministes, journalisation continue et exécution sûre sous des essais et des échecs répétés.
Cela donne aux équipes un espace pour se former, évaluer et itérer sur les politiques basées sur l'apprentissage dans le monde réel au lieu de considérer le déploiement comme le premier véritable test.