لماذا يعد جمع البيانات باليدين أكثر صعوبة؟
في جمع البيانات بذراع واحدة، يؤثر العرض التوضيحي السيئ على مسار ذراع واحدة فقط. يمكنك تسجيل 50 عرضًا توضيحيًا، وتجاهل 5 منها سيئة، والتدريب على 45. في جمع البيانات يدويًا، يؤدي الخطأ عند نقطة التسليم إلى إبطال كلاهما مسارات الأسلحة لهذا العرض التوضيحي في وقت واحد. تقترن أوضاع الفشل.
هذا الاقتران له أثران عمليان. أولاً، أنت بحاجة إلى المزيد من العروض التوضيحية - 100 بدلاً من 50 - لأن المهام اليدوية بها تباين أعلى وتحتاج السياسة إلى المزيد من الأمثلة للتعرف على هيكل التنسيق. ثانيًا، أنت بحاجة إلى اتساق أكثر صرامة لكل عرض توضيحي. عرض توضيحي بذراع واحدة يتدرب بنسبة 80% بشكل جيد إلى حد معقول. إن العرض التوضيحي ثنائي اليد، حيث تكون إحدى الذراعين متسقة والأخرى مختلفة، لا يعلم السياسة أي شيء مفيد فيما يتعلق بتوقيت التنسيق.
كما أن تحدي تغطية مساحة العمل أكبر أيضًا: فأنت تحتاج إلى وضع كلا الذراعين في الإطار، ويجب أن يتم التقاط نقطة التسليم - وهي اللحظة الأكثر تعقيدًا - بشكل موثوق بواسطة كاميرا واحدة على الأقل. تحقق من زوايا الكاميرا قبل البدء واضبطها إذا حدثت عملية التسليم خارج مجال رؤية كاميرا مساحة العمل.
تنسيق مجموعة البيانات LeRobot Bimanual
يعمل تكامل DK1 مع LeRobot على توسيع التنسيق القياسي للذراع الواحد مع مصفوفات الحالة المشتركة المزدوجة. تحتوي كل خطوة زمنية في مجموعة البيانات على:
الفرق الرئيسي عن الذراع الواحدة: مساحة الحركة هي 14 بعدًا (6+6 مفاصل + 2 قابض). يعالج ACT هذا الأمر بشكل أصلي - حيث تحدد بُعد الإجراء في تكوين التدريب ولا يلزم إجراء أي تغييرات أخرى.
تسجيل سير العمل
قم بتشغيل 10-15 عرضًا تجريبيًا قبل بدء جلسة التسجيل لتسخين ذاكرتك الحركية للمهمة. ستكون أول 5 إلى 10 عروض توضيحية مسجلة هي الأسوأ بالنسبة لك – وهذا متوقع. ولا تتوقف عن مراجعتها أثناء الجلسة؛ قم بمراجعة العروض التوضيحية السيئة وإعدامها بعد تسجيل 100 نسخة كاملة.
قائمة التحقق من الجودة للبيانات الثنائية
قم بمراجعة كل عرض توضيحي بعد التسجيل باستخدام عارض إعادة التشغيل الخاص بـ LeRobot. تجاهل أي عرض توضيحي يفشل في اثنين أو أكثر من هذه المعايير:
اكتملت الوحدة الرابعة عندما...
لديك 100 عرض توضيحي مسجل بتنسيق LeRobot على ~/dk1-datasets/cube-handoff-v1/. بعد المراجعة والاختيار، اجتاز ما لا يقل عن 90 عرضًا تجريبيًا قائمة فحص الجودة. كلا صفيفات الحالة المشتركة موجودة عند 50 هرتز لكل حلقة. كلا موجزي الكاميرا موجودان ويعرضان تسلسل المهام الكامل بما في ذلك لحظة التسليم. لقد ركضت python -m lerobot.scripts.visualize_dataset --repo-id cube-handoff-v1 وأكد أن بنية مجموعة البيانات صالحة.