No es un simulador. Un sistema real operable de manera continua.
En nuestro contexto, un entorno RL es un sistema robótico real completamente especificado: configuración física, tareas y criterios de éxito claramente definidos, espacios de observación y acción estables, procedimientos de reinicio deterministas, registro continuo y ejecución segura bajo pruebas y fallos repetidos.
Esto brinda a los equipos un lugar para entrenar, evaluar e iterar sobre políticas basadas en el aprendizaje en el mundo real en lugar de tratar el despliegue como la primera prueba verdadera.