הַגדָרָה

DAgger (צבירת נתונים) מטפלת בבעיית שינוי ההפצה בשיבוט התנהגות. בתקן BC, הלומד רואה רק מצבים מהפצת המומחים, אך במהלך הפריסה הוא נתקל במצבים חדשים בשל פעולותיו הלא מושלמות. DAgger מנהל באופן איטרטיבי את המדיניות הנוכחית, אוסף מדינות חדשות, מבקש מהמומחה לתייג אותן בפעולות נכונות, ומכשיר מחדש. זה מכסה בהדרגה את המדינות שבהן הלומד מבקר בפועל. גרסאות כוללות את SafeDAgger (עם אילוצי בטיחות) ו-HG-DAgger (עם התערבויות ביד אדם).

למה זה חשוב עבור צוותי רובוט

הבנת פגיון חיונית לצוותים שבונים מערכות רובוט בעולם האמיתי. בין אם אתה אוסף נתוני הדגמה, מדיניות הדרכה בסימולציה או פריסה בייצור, הרעיון הזה משפיע ישירות על זרימת העבודה ועיצוב המערכת שלך.