لماذا تتفوق جودة البيانات على كمية البيانات؟

غالبًا ما تتفوق مجموعة البيانات المكونة من 1000 عرض توضيحي متنوع وعالي الجودة على 10000 عرض صاخب. تنتشر مشكلات الجودة - عدم تزامن أجهزة الاستشعار، وانقطاع العمل، وفشل المهام الممزوج بالنجاحات، ووضع العلامات غير المتسقة - في السياسات المدربة وتتسبب في حالات فشل غامضة في النشر.

قائمة مراجعة الجودة المكونة من 15 نقطة

قم بتطبيق عمليات التحقق هذه على كل دفعة من الحلقات المجمعة قبل إضافتها إلى مجموعة التدريب الخاصة بك.

  • الطوابع الزمنية للمستشعر متزامنة خلال 10 مللي ثانية
  • لا توجد إطارات كاميرا مسقطة (تحقق من عدد الإطارات مقابل المدة)
  • قيم العمل ضمن حدود المفاصل المادية
  • لا توجد انقطاعات في العمل> 2σ من متوسط ​​حجم الخطوة
  • تم التحقق من تسميات النجاح/الفشل بواسطة المراجع الثاني
  • اكتملت المهمة ضمن حدود المدة المتوقعة
  • لا يوجد تصحيحات ذاتية للمشغل في مجموعة البيانات النهائية
  • عدم حجب الكاميرا خلال المراحل الحرجة
  • يتطابق استقبال الحس العميق مع الإجراءات المطلوبة
  • تنتقل حالة القابض في اللحظات الصحيحة
  • لا توجد حلقات مكررة
  • حقول البيانات التعريفية مكتملة (معرف المهمة، عامل التشغيل، التاريخ)
  • الحلقة مخزنة بالتنسيق المستهدف (RLDS/LeRobot)
  • إحصائيات الدفعة ضمن التوزيعات المتوقعة
  • عينة عشوائية تم فحصها بصريا