قم بتوصيل الروبوت الخاص بك أو افتح المحاكاة
إذا كنت تستخدم روبوتًا حقيقيًا، فقم بتوصيله الآن وتأكد من تعرف النظام عليه قبل تشغيل أمر التسجيل. إذا كنت تعمل في مجال المحاكاة، فيمكن لأمر التسجيل أن يقود روبوتًا افتراضيًا في gym_pusht أو gym_aloha البيئات التي تستخدم لوحة مفاتيح أو سياسة مكتوبة كمصدر التشغيل عن بعد.
يجب أن تشاهد الحالات المشتركة تتدفق في مخرجات المحطة الطرفية و(بالنسبة للروبوتات الحقيقية) تستجيب الذراع للمدخلات. إذا لم يكن الأمر كذلك، قم بحل مشكلة الاتصال قبل المتابعة - يؤدي التسجيل باستخدام روبوت منفصل بصمت إلى ظهور بيانات تالفة.
أمر التسجيل
أمر التسجيل الأساسي. قم بتكييف العلامات مع الإعداد الخاص بك:
--robot-path مع التكوين سيم الخاص بك. يضيف --env-name gym_pusht/PushT-v0 و --policy-path lerobot/act_pusht_keypoints لتسجيل العروض التوضيحية المكتوبة (وليست البشرية) لمجموعة بيانات أساسية.
كم عدد المظاهرات؟
يعتمد الرقم الصحيح على الإعداد الخاص بك:
- محاكاة: 50 حلقة مكتوبة كافية لسياسة خط الأساس. البيئة حتمية، لذا فإن التباين منخفض و50 يكفي لتقارب ACT.
- روبوت حقيقي، مهمة بسيطة: 50-80 مظاهرة بشرية. يمكن أن يتدرب الالتقاط والوضع مع موضع كائن ثابت جيدًا عند الطرف الأدنى من هذا النطاق إذا كانت عروضك التوضيحية متسقة.
- روبوت حقيقي، مهمة متغيرة: 100-200 مظاهرة. إذا كانت مواضع الكائنات تختلف، أو إذا كانت المهمة تتطلب خطوات فرعية متعددة، فأنت بحاجة إلى مزيد من التغطية.
لهذا المسار، الهدف 50 مظاهرة كحد أدنى. الجودة تتفوق على الكمية - 50 عرضًا توضيحيًا متسقًا يتفوق على 150 عرضًا قذرًا في كل مرة.
ممارسات العرض الجيدة
إعداد مساحة عمل متسقة
إعادة تعيين الكائنات إلى نفس الموضع قبل كل حلقة. استخدم الشريط اللاصق الموجود على الطاولة لتحديد مواضع البداية. ستتعلم السياسة من توزيع المواضع في عروضك التوضيحية - إذا كانت جميعها في نفس المكان، فستتم معايرة السياسة لذلك المكان.
حلقات كاملة وكاملة
يجب أن تبدأ كل حلقة من نفس الوضعية المنزلية وتنتهي بإكمال المهمة بالكامل. لا تتوقف عن التسجيل في منتصف المهمة. إن الحلقة غير المكتملة التي يكون فيها القابض في منتصف الطريق من خلال الإمساك تعلم النموذج سلوكًا مكسورًا.
حركات متعمدة وسلسة
تحرك بسرعة 40-60% من السرعة القصوى. بطيء بما يكفي ليكون سلسًا وسريعًا بما يكفي حتى لا يكون متوترًا. يتعلم النموذج التوقيت من عروضك التوضيحية، فالسرعة غير المنتظمة تنتج سياسات غير منتظمة.
العروض التوضيحية الجزئية أو المجهضة
إذا قمت بإسقاط الكائن، أو الاصطدام بمساحة العمل، أو حدوث خطأ، فاضغط على Ctrl+C لإحباط الحلقة. سيتم تجاهل الحلقة. لا تقم أبدًا بدفع حلقة تم إحباطها - فهي تسمم مجموعة البيانات.
استراتيجيات غير متناسقة
لا تخلط بين الاستراتيجيات: لا تمسك من اليسار في بعض العروض ومن اليمين في بعضها الآخر. اختر طريقة واحدة واستخدمها في كل حلقة. تتعلم CVAE الخاصة بـ ACT "أسلوبًا" واحدًا - حيث يجبرها عدم الاتساق على استخدام المتوسط، ولا تنتج أيًا من الاستراتيجيتين بشكل موثوق.
ادفع إلى HuggingFace Hub
إذا لم تقم بتعيين --dataset.push-to-hub 1 أثناء التسجيل، اضغط يدويًا بعد الجلسة:
--private 1 إلى أمر الدفع. تساهم مجموعات البيانات العامة في مجتمع الروبوتات وقد تظهر في مكتبة مجموعة بيانات SVRC.
اكتملت الوحدة الثالثة عندما...
لديك ما لا يقل عن 50 عرضًا توضيحيًا كاملاً لم يتم إحباطه في مجموعة بيانات LeRobot على HuggingFace Hub. يمكنك تحميل مجموعة البيانات الخاصة بك مع LeRobotDataset("your-username/pick-place-v1") ومعرفة عدد الحلقات المتوقعة. لقد قمت بتصور ما لا يقل عن 5 من الحلقات الخاصة بك باستخدام lerobot.scripts.visualize_dataset وأكد أن مسارات المفاصل تبدو سلسة وأن تغيرات حالة القابض نظيفة. أنت جاهز للتدريب في الوحدة الرابعة.