Real-World RL Environment לחזרה מהירה יותר של מדיניות

צוות רובוטיקה עבר מבדיקות כבדות סימולציה לסביבות מתמשכות בעולם האמיתי ואמינות מדד משופרת.

אֶתגָר

הסימולציה עוברת אבל רגרסיות בעולם האמיתי

הצוות ראה רגרסיות חוזרות ונשנות של מדיניות בעת המעבר מסימולציה לחומרה עקב וריאציה של מגע וסחיפה של איפוס.

פתרון SVRC
  • תא סביבה מתמשךהיגיון איפוס חוזר וסנכרון חיישן יציב.
  • לוח המחוונים של הפעלה חוזרת של כשלניסוי מהיר של אשכולות רגרסיה ומעקב ברמת התרחישים.
  • בדיקות שער מדיניותשער בנצ'מרק לפני כל קידום.
תוצאות תוך 10 שבועות
  • שיעור מעבר בנצ'מרק: 58% -> 84%
  • אירועי רגרסיה לכל שחרור: ירידה של 47%
  • שחרור ציון אמון: עלייה של 31%

בנה את תוכנית הסביבה שלך

בחר מצב פיילוט, מתמשך או שותפות בהתבסס על משימת יעד וקצב איטרציה.