לא סימולטור. מערך הפועל ברציפות בעולם האמיתי.
בהקשר שלנו, סביבת RL היא מערכת רובוטית אמיתית שצוינה במלואה: הגדרה פיזית, משימות וקריטריוני הצלחה מוגדרים בבירור, מרחבי תצפית ופעולה יציבים, נהלי איפוס דטרמיניסטיים, רישום מתמשך וביצוע בטוח תחת ניסויים וכשלים חוזרים ונשנים.
זה נותן לצוותים מקום להתאמן, להעריך ולחזור על מדיניות מבוססת למידה בעולם האמיתי במקום להתייחס לפריסה כמבחן האמיתי הראשון.