מדוע איכות נתונים מנצחת את כמות הנתונים

מערך נתונים של 1,000 הדגמות איכותיות ומגוונות עולה לרוב על 10,000 הדגמות רועשות. בעיות איכות - ביטול סנכרון של חיישנים, אי רציפות בפעולות, כשלים במשימות מעורבות בהצלחות ותוויות לא עקביות - מתפשטות לתוך מדיניות מיומנת וגורמות לכשלי פריסה מסתוריים.

רשימת 15 נקודות איכות

החל את הבדיקות האלה על כל אצווה של פרקים שנאספו לפני הוספתם לסט האימונים שלך.

  • חותמות זמן של חיישן מסונכרנות תוך 10ms
  • ללא פריימים של מצלמה שנפלו (בדוק את ספירת הפריימים לעומת משך הזמן)
  • ערכי פעולה בגבולות המפרק הפיזיים
  • אין הפסקות פעולה >2σ מגודל הצעד הממוצע
  • תוויות הצלחה/כישלון מאומתות על ידי סוקר שני
  • המשימה הושלמה בגבולות המשך הצפוי
  • אין תיקונים עצמיים של מפעיל במערך הנתונים הסופי
  • המצלמה לא חסומה בשלבים קריטיים
  • פרופריוספציה תואמת פעולות מצוות
  • מעברי מצב גריפ ברגעים נכונים
  • אין פרקים כפולים
  • שדות מטא נתונים מלאים (מזהה משימה, אופרטור, תאריך)
  • פרק מאוחסן בפורמט יעד (RLDS/LeRobot)
  • סטטיסטיקות אצווה בתוך הפצות צפויות
  • מדגם אקראי נבדק נקודתית חזותית