← מילון מונחים

לימוד חיקוי

למידה מהדגמות - רובוטים המשכפלים התנהגות אנושית מנתוני טלאופרציה.

מהי לימוד חיקוי?

למידת חיקוי (IL) היא פרדיגמה שבה רובוט לומד לבצע משימות על ידי התבוננות ושכפול של הדגמות של מומחים. במקום ללמוד מאותות תגמול (כמו בלימוד חיזוק), הרובוט לומד מזוגות פעולה של מצב שנאספו במהלך טלאופרציה אנושית או הוראה קינסתטית.

גישות מפתח

  • שיבוט התנהגות (BC) - למידה מפוקחת מזוגות (התבוננות, פעולה). פשוט אך נוטה לשינוי תפוצה.
  • פִּגיוֹן - איסוף נתונים איטרטיבי: הפעל מדיניות, קבל תיקוני מומחים, הדרכה מחדש. מפחית את תזוזת ההפצה.
  • למידה חיזוקית הפוכה (IRL) - הסיק את תפקוד התגמול מהדגמות, ולאחר מכן ייעל את המדיניות.

משאבים קשורים