جمع البيانات
قم بتسجيل ضغط التلامس جنبًا إلى جنب مع حالة مفصل الروبوت وفيديو الكاميرا. يضيف القفاز طريقة لمسية تلتقطها كم هو صعب يضغط قابض الروبوت - وهي معلومات غير مرئية للرؤية وحدها.
اتصالات النظام
قم بتوصيل جميع الأجهزة قبل بدء تشغيل أي برنامج. القفاز متصل بسلك USB بشكل صارم - ولا يوجد وضع لاسلكي.
ذراع الروبوت + اليد
Orca Hand (مستحسن) أو أي مؤثر نهائي آخر. يتم توصيله عبر محول Feetech USB أو CAN، اعتمادًا على الذراع.
/dev/ttyUSB0 or CAN0قفاز جوكياو
USB-C لاستضافة جهاز الكمبيوتر. يظهر كمسلسل CDC-ACM. كابل 1.5 متر؛ استخدم امتداد USB إذا لزم الأمر من أجل حرية الحركة.
/dev/ttyACM0كاميرا المعصم
كاميرا USB أو GigE مثبتة على معصم الروبوت، مما يوفر رؤية تتمحور حول الكائن للتدريب.
/dev/video0 or GigE IPالكاميرا العلوية
كاميرا مساحة العمل الثابتة لسياق المشهد. قم بالاقتران مع كاميرا المعصم لمجموعات البيانات متعددة العرض.
/dev/video2 or GigE IPجهاز التشغيل عن بعد
ذراع القائد (SO-101 / OpenArm Leader)، أو وحدة تحكم VR، أو SpaceMouse الذي يقود الروبوت التابع.
منفذ القائد/HIDالتسجيل خطوة بخطوة
ارفع ذراع الروبوت ويده
قم بتشغيل برنامج تشغيل الذراع (وبرنامج تشغيل Orca Hand إن أمكن) في أطراف منفصلة. تحقق من نشر الحالات المشتركة قبل المتابعة.
بدء تشغيل برنامج تشغيل Juqiao Glove
قم بتشغيل عقدة القفاز ROS2. تحقق من تدفق البيانات بتردد 200 هرتز قبل البدء في أي جلسة تسجيل.
إطلاق الكاميرات
بدء عقد الكاميرا لوجهات النظر المعصم والعلوية. تأكد من نشر موضوعات الصور بمعدل الإطارات المستهدف (عادةً 30 إطارًا في الثانية).
تحقق من مزامنة كافة التدفقات
يستخدم قائمة موضوعات ros2 للتأكد من وجود كافة المواضيع المطلوبة. تحقق من الطوابع الزمنية في حدود 20 مللي ثانية عبر الطرائق قبل تسجيل أي حلقات.
قم بتسجيل مجموعة بيانات باستخدام LeRobot
استخدم البرنامج النصي لتسجيل LeRobot. ال --موضوع اللمس تضيف العلامة تدفق ضغط القفاز كعمود مجموعة بيانات إلى جانب الحالات والصور المشتركة.
مراجعة الحلقات قبل الدفع
أعد تشغيل كل حلقة باستخدام تراكب الخريطة الحرارية للتحقق من جودة البيانات الملموسة قبل الالتزام بـ HuggingFace Hub.
ادفع إلى HuggingFace Hub
قم بتحميل مجموعة البيانات التي تم التحقق من صحتها. يتم إنشاء بطاقة مجموعة البيانات تلقائيًا بأوصاف الطريقة بما في ذلك اللمس.
مخطط مجموعة البيانات
يحتوي كل إطار في مجموعة البيانات على الأعمدة التالية. يتم تخزين جميع المصفوفات كأعمدة باركيه float32؛ الصور كتسلسلات فيديو MP4.
| عمود | الشكل / النوع | وصف |
|---|---|---|
| مراقبة.حالة | تعويم32[6] | مواضع مفصل ذراع الروبوت (راديان). الفهرس 6 هو فتحة القابض في حالة استخدام ذراع 6-DOF. |
| مراقبة.hand_state | تعويم32[17] | مواضع مفصل يد Orca (الراديان)، 17 DOF. حذف إذا لم يكن هناك يد حاذقة. تم تصنيفها حسب الاسم المشترك في البيانات التعريفية. |
| الملاحظة.tactile_pressures | تعويم32[64] | Juqiao Glove الضغط الطبيعي لكل عقدة، من 0.0 (بدون اتصال) إلى 1.0 (النطاق الكامل). تم تقليل حجمها بمقدار 200 هرتز لتتناسب مع معدل إطارات الروبوت. |
| الملاحظة.tactile_pressures_raw | يونت16[64] | قيم ADC الأولية ذات 16 بت. الحفاظ على إعادة التطبيع بعد إعادة المعايرة. خياري؛ تجاهل تقليل حجم مجموعة البيانات. |
| مراقبة.grasp_region | شارع | منطقة الاتصال النشطة الإرشادية: "نخل", "إبهام", "فِهرِس", "وسط", "جرس", "الخنصر"، أو "" (لا يوجد اتصال). |
| Observation.images.wrist | uint8[ح، ث، 3] | إطار RGB لكاميرا المعصم بمعدل 30 إطارًا في الثانية، ومخزن كتسلسل فيديو MP4. |
| Observation.images.overhead | uint8[ح، ث، 3] | إطار RGB للكاميرا العلوية بمعدل 30 إطارًا في الثانية. |
| فعل | تعويم 32 [6 أو 23] | استهدف مواضع المفصل للذراع (6) واليد اختياريًا (17). يعتمد الشكل على ما إذا كانت اليد الماهرة موجودة أم لا. |
| language_instruction | شارع | وصف المهمة، على سبيل المثال. "التقط البيضة دون أن تكسرها". تمكين التدريب على السياسات المشروطة باللغة. |
| الحلقة_index | كثافة العمليات | رقم الحلقة ضمن مجموعة البيانات. |
| frame_index | كثافة العمليات | رقم الإطار داخل الحلقة (0-مفهرس). |
| الطابع الزمني | float64 | مرت ثواني منذ بداية الحلقة. |
الاختزال عن طريق اللمس
يتدفق القفاز بسرعة 200 هرتز. يعمل الروبوت والكاميرات عادةً بتردد 30-100 هرتز. يقوم المُسجل بمحاذاة الإطارات باستخدام مطابقة الطابع الزمني لأقرب جار. للحفاظ على التدفق اللمسي الكامل بتردد 200 هرتز كمصفوفة منفصلة:
قائمة التحقق من جودة الحلقة
قم بمراجعة كل حلقة وفقًا لهذه المعايير قبل تضمينها في مجموعة البيانات الخاصة بك. ومن الممكن أن تؤدي حادثة واحدة سيئة إلى تقديم أنماط ملموسة زائفة تؤدي إلى تدهور التدريب على السياسات.
-
التدفق اللمسي مستمر — ولا توجد فجوات في الإطار يؤكد frame.sequence زيادات دون تخطي. تظهر قطرات الإطار كقيم متكررة في عمود اللمس.
-
خط الأساس عند الراحة قريب من الصفر (<0.03) عند بداية الحلقة (قبل أي اتصال)، يجب أن تقرأ عقدة الضغط الأقصى أقل من 0.03. يشير الانجراف فوق 0.05 في حالة الراحة إلى أن القفاز يحتاج إلى إعادة معايرة.
-
تتوافق أحداث الاتصال مع الفهم المرئي في الفيديو إعادة مع --تراكب اللمس. يجب أن تتزامن ارتفاعات الضغط (العقدة القصوى > 0.4) مع إغلاق القابض المرئي في كاميرا المعصم.
-
منطقة الإمساك متسقة خلال مرحلة الاتصال فهم_منطقة يجب أن يستقر على منطقة واحدة أو منطقتين خلال كل قبضة (على سبيل المثال. "نخل" + "فِهرِس"). تشير المناطق المتغيرة بسرعة إلى عدم محاذاة القفاز أو وجود إشارة صاخبة.
-
زمن وصول القفاز < 20 مللي ثانية بالنسبة لحالة الروبوت قارن بداية الحدث الملموس بارتفاع سرعة القابض. الكمون > 20 مللي ثانية يشير إلى ازدحام لوحة وصل USB - قم بتوصيل القفاز مباشرة بمنفذ USB مضيف.
-
يتوافق تعليم اللغة مع المهمة الموضحة بالنسبة لمجموعات البيانات مكيفة اللغة، تأكد من أن التعليمات التي تم إدخالها في بداية الحلقة تصف بدقة ما أظهره المشغل بالفعل.
-
لا يوجد تداخل في الكابل مع حركة الروبوت يجب ألا يعيق كبل USB بطول 1.5 متر حركات يد المشغل أو يسحب القفاز أثناء الحلقة. استخدم مشبك إدارة الكابلات على الساعد.
التدريب على الملاحظات اللمسية
عادةً ما تشهد السياسات التي تستهلك المدخلات اللمسية تحسنًا بنسبة 15-30% في المهام الحساسة للاتصال (التعامل مع الأشياء الهشة، وإدخال الأوتاد، وطي القماش) مقارنةً بخطوط الأساس الخاصة بالرؤية فقط.