מדוע איכות נתונים מנצחת את כמות הנתונים
מערך נתונים של 1,000 הדגמות איכותיות ומגוונות עולה לרוב על 10,000 הדגמות רועשות. בעיות איכות - ביטול סנכרון של חיישנים, אי רציפות בפעולות, כשלים במשימות מעורבות בהצלחות ותוויות לא עקביות - מתפשטות לתוך מדיניות מיומנת וגורמות לכשלי פריסה מסתוריים.
רשימת 15 נקודות איכות
החל את הבדיקות האלה על כל אצווה של פרקים שנאספו לפני הוספתם לסט האימונים שלך.
- חותמות זמן של חיישן מסונכרנות תוך 10ms
- ללא פריימים של מצלמה שנפלו (בדוק את ספירת הפריימים לעומת משך הזמן)
- ערכי פעולה בגבולות המפרק הפיזיים
- אין הפסקות פעולה >2σ מגודל הצעד הממוצע
- תוויות הצלחה/כישלון מאומתות על ידי סוקר שני
- המשימה הושלמה בגבולות המשך הצפוי
- אין תיקונים עצמיים של מפעיל במערך הנתונים הסופי
- המצלמה לא חסומה בשלבים קריטיים
- פרופריוספציה תואמת פעולות מצוות
- מעברי מצב גריפ ברגעים נכונים
- אין פרקים כפולים
- שדות מטא נתונים מלאים (מזהה משימה, אופרטור, תאריך)
- פרק מאוחסן בפורמט יעד (RLDS/LeRobot)
- סטטיסטיקות אצווה בתוך הפצות צפויות
- מדגם אקראי נבדק נקודתית חזותית