لماذا تعتبر جودة البيانات أكثر أهمية من الكمية؟
من المفاهيم الخاطئة الشائعة في تعلم الروبوتات أن المزيد من العروض التوضيحية تنتج تلقائيًا سياسة أفضل. هذا غير صحيح. تتعلم الشبكات العصبية تقليد توزيع السلوك في مجموعة البيانات الخاصة بك. إذا كانت عروضك التوضيحية غير متسقة - مسارات مختلفة، وسرعات مختلفة، ومواضع مختلفة للأشياء - فإن الشبكة تتعلم متوسطًا ضبابيًا لا يتوافق مع أي استراتيجية ناجحة فعلية.
50 عرضًا توضيحيًا حيث تأخذ الذراع نفس المسار النظيف، وتمسك الجسم في نفس الموقع، وتعود إلى نفس الوضع الأصلي، سوف تنتج سياسة تعمم بشكل أفضل من 500 عرض توضيحي بتباين عالٍ. جلسة التجميع الأولى هي فرصتك لإثبات هذا الاتساق. خذ وقتك. احذف وأعد تسجيل أي عرض توضيحي يبدو خاطئًا.
للحصول على أسس أعمق في تصميم خطوط الأنابيب، اقرأ نظرة عامة على خط أنابيب جمع البيانات في مكتبة الروبوتات.
تنسيق مجموعة بيانات LeRobot
سيتم حفظ التسجيلات الخاصة بك في تنسيق ليروبوت - المعيار الذي تستخدمه مكتبة LeRobot التابعة لشركة Hugging Face والمتوافق مع مدربي ACT وDiffusion Policy الذين ستستخدمهم في الوحدة 5.
ما يتم تسجيله
المواضع المشتركة (6 DOF + القابض)، وسرعات المفاصل، ووضعية المؤثر النهائي، وإطارات الكاميرا (RGB + العمق الاختياري)، والطوابع الزمنية، وبيانات تعريف المهمة.
هيكل الملف
مجلد واحد لكل حلقة. تحتوي كل حلقة على data.parquet مع صفائف الحالة/الإجراء و video/ مجلد فرعي مع تيارات الكاميرا.
معدل أخذ العينات
50 هرتز بشكل افتراضي. تنتج كل ثانية من العملية عن بعد 50 خطوة زمنية. يؤدي الانتقاء والمكان لمدة 10 ثوانٍ إلى إنتاج 500 زوج (حالة، إجراء).
التوافق
يتم تحميل تنسيق LeRobot مباشرةً إلى ملف lerobot.common.datasets. كما أنه قابل للتحويل إلى RLDS لخطوط أنابيب TF-Agents. تصفح مجموعات البيانات المرجعية →
جلسة التسجيل الخاصة بك
قم بتشغيل البرنامج النصي للتسجيل باسم مهمتك وعدد الحلقات المستهدفة. يتعامل البرنامج النصي مع إدارة الحلقات وتسمية الملفات ووضع علامة على الجودة تلقائيًا:
قم بإعداد مساحة العمل الخاصة بك بنفس الكائن في نفس موضع البداية لكل حلقة. استخدم علامات الشريط على الطاولة للحفاظ على ثبات موضع الكائن. يجب أن تعود ذراعك إلى نفس الوضعية الرئيسية تمامًا قبل بدء كل حلقة، ويفرض نص التسجيل ذلك من خلال التحقق من التوجيه.
نصيحة عملية: اهدف إلى أن تتراوح مدة الحلقات ما بين 8 إلى 15 ثانية. قصيرة جدًا (أقل من 5 ثوانٍ) وليس لدى السياسة الوقت الكافي للتخطيط لمسار سلس. طويلة جدًا (أكثر من 20 عامًا) وتتفاقم الاختلافات الصغيرة. بالنسبة للاختيار والمكان القياسي، يكون الهدف هو 10 ثوانٍ لكل حلقة.
قائمة التحقق من جودة البيانات
قبل التقدم إلى الوحدة 5، تأكد من اجتياز مجموعة البيانات الخاصة بك جميع هذه الاختبارات الخمسة. تجاهل وإعادة تسجيل الحلقات التي تفشل في أي عنصر.
- لا يوجد فهم فاشل. تنتهي كل حلقة بوضع الكائن بنجاح في الموقع المستهدف. يجب حذف الحلقات التي أخطأت فيها الذراع الإمساك بالشيء أو أسقطته، فهي تعلم النموذج الفشل.
- تشكل بداية متسقة. تبدأ الذراع من موضعها في كل حلقة. تحقق في عارض مجموعة البيانات من أن الزوايا المشتركة في الخطوة الزمنية 0 تقع ضمن ±2 درجة من بعضها البعض عبر جميع الحلقات الخمسين.
-
لا توجد قفزات أو هزات مفاجئة. تصور 3-5 حلقات عشوائية مع
python -m lerobot.visualize_dataset --dataset ~/openarm-datasets/pick-and-place. يجب أن تكون تسلسلات الحركة منحنيات سلسة ومستمرة وليست تصاعدية. - إطارات الكاميرا واضحة ومركزة. تأكد من أن كاميرا مساحة العمل الخاصة بك ليست محجوبة، وأنها غير مضاءة بالضوء المباشر، وأن الكائن مرئي بوضوح طوال كل حلقة. يؤدي الفيديو الباهت أو الداكن إلى تدهور أداء السياسة.
-
تم حفظ 50 حلقة كاملة. يجري
python -m lerobot.inspect ~/openarm-datasets/pick-and-placeوتأكد من أن لديك 50 حلقة بالضبط بدون ملفات تالفة. سيقوم البرنامج النصي بوضع علامة على أي حلقات ذات إطارات مفقودة أو تسلسلات عمل مبتورة.
تصفح مجموعات البيانات المرجعية للمقارنة
تحتوي مكتبة مجموعة بيانات SVRC على أمثلة لتسجيلات الانتقاء والمكان التي يمكنك استخدامها كمرجع للجودة. إذا كانت بياناتك تبدو مختلفة بشكل كبير، فتحقق منها قبل التدريب. افتح مجموعات بيانات SVRC →
اكتملت الوحدة الرابعة عندما...
لديك 50 حلقة نظيفة محفوظة بتنسيق LeRobot على ~/openarm-datasets/pick-and-place. تم اجتياز جميع عناصر قائمة التحقق من الجودة الخمسة. جري lerobot.inspect يعرض 50 حلقة، بدون أخطاء. أنت جاهز لتسليم مجموعة البيانات هذه إلى مسار التدريب في الوحدة 5.