جمع البيانات

يختلف جمع البيانات البشرية بشكل أساسي عن سير العمل بالذراع فقط. يتمتع K1 بأكثر من 22 درجة من الحرية، ويجب أن يحافظ على التوازن أثناء التشغيل عن بعد، ويتطلب التقاطًا متزامنًا متعدد الوسائط. تغطي هذه الصفحة التحديات والأساليب وتنسيق مجموعة البيانات وبروتوكول السلامة.

تحديات جمع البيانات البشرية

يتطلب جمع العروض التوضيحية عالية الجودة على جهاز بشري بالحجم الكامل معالجة التحديات التي لا توجد على أذرع سطح المكتب.

التوازن أثناء التشغيل عن بعد

يجب أن يحافظ K1 على توازن الجسم بالكامل بينما يتحكم المشغل في الذراعين. تحرك حركات الذراع مركز الكتلة، مما يتطلب من وحدة التحكم في الحركة التعويض بشكل مستمر. يمكن لأوامر الذراع السريعة أن تزعزع استقرار الروبوت.

📊

الدولة عالية الأبعاد

تشتمل حالة مفصل الجسم بالكامل على 22 DOF بالإضافة إلى IMU ووضعية الرأس وحالة اليد الاختيارية - أكثر من 30 بُعدًا لكل خطوة زمنية. تعد ملفات مجموعة البيانات أكبر بكثير من مجموعات البيانات المخصصة للذراع فقط. تخطيط التخزين أمر ضروري.

📷

مزامنة الكاميرات المتعددة

تتطلب المهام البشرية عادةً كاميرات أنانية (مثبتة على الرأس) وكاميرات خارجية (خارجية). تتطلب مزامنة تدفقات الفيديو المتعددة مع القياس عن بعد المشترك عند 50 هرتز+ تصميمًا دقيقًا لخط الأنابيب.

👥

تعب المشغل

إن التشغيل عن بعد لكامل الجسم القائم على الواقع الافتراضي يتطلب جهدًا بدنيًا. تؤدي الجلسات التي تزيد مدتها عن 30 دقيقة لكل مشغل إلى انخفاض جودة العرض التوضيحي بشكل كبير. خطط لتناوب المشغلين في حملات التجميع الموسعة.

طرق التشغيل عن بعد للبشر

يتم دعم طريقتين أساسيتين للتشغيل عن بعد للجزء العلوي من الجسم. يتم التحكم في الحركة دائمًا عبر أوامر السرعة من لوحة الألعاب أو بشكل مستقل.

VR لكامل الجسم عن بعد مُستَحسَن

يستخدم Meta Quest 3 أو سماعة رأس VR مشابهة لتتبع وضعية رأس المشغل ويده. تعكس مفاصل الرأس والذراع في K1 حركات المشغل في الوقت الفعلي. يوفر المظاهرات الأكثر طبيعية ومعبرة.

يثبت: Quest 3 + عقدة SteamVR، k1_vr_teleop ROS2، يرتدي المشغل قفازات لتتبع اليد.

كمون: ~20 مللي ثانية للرأس، ~40 مللي ثانية للذراع من طرف إلى طرف.

الأفضل لـ: مهام التلاعب، والاختيار والمكان، والتلاعب في موضع الجسم بالكامل.

الجزء العلوي من الجسم للقائد والتابع متقدم

يعكس الهيكل الخارجي الثاني أو نظام الذراع القائد الجزء العلوي من جسم التابع K1. يتم تعيين الزوايا المشتركة مباشرة من القائد إلى التابع. لا يتطلب أجهزة الواقع الافتراضي.

يثبت: يتطلب نظام ذراع قائد متوافقًا (على سبيل المثال، مجموعة OpenArm اليدوية أو الهيكل الخارجي المخصص). اتصل بـ SVRC للحصول على تكوينات الشريك.

الأفضل لـ: معالجة دقيقة باليدين حيث تكون دقة التتبع أمرًا بالغ الأهمية.

الحركة أثناء العملية عن بعد

عادةً ما يتم دمج التشغيل عن بعد للجزء العلوي من الجسم مع الحركة التي يتم التحكم فيها بواسطة لوحة الألعاب. يستخدم المشغل لوحة ألعاب لاسلكية للتحكم في سرعة المشي بينما يتحكم نظام الواقع الافتراضي في الذراعين والرأس:

# Launch combined teleop: VR for upper body + gamepad for locomotion
ros2 launch k1_teleop k1_combined_teleop.launch.py \
  vr_device:=quest3 \
  gamepad:=xbox \
  robot_ip:=192.168.10.102

تنسيق مجموعة بيانات الجسم بالكامل (30+ DoF)

تسجل كل حلقة حالة المفصل المتزامنة وإطارات الكاميرا والبيانات الوصفية. التنسيق متوافق مع مجموعات بيانات LeRobot وHuggingFace.

هيكل الحلقة

episode_000001/
  joint_states.npy      # [T, 44] — positions, velocities, torques for 22 joints
  imu.npy               # [T, 6]  — accel (3) + gyro (3) from torso IMU
  head_pose.npy         # [T, 2]  — yaw and pitch in radians
  head_cam.mp4          # 1280x720 @ 30 fps, head-mounted egocentric
  left_cam.mp4          # 1280x720 @ 30 fps, left wrist
  right_cam.mp4         # 1280x720 @ 30 fps, right wrist
  external_cam.mp4      # 1920x1080 @ 30 fps, fixed external view
  timestamps.npy        # [T] unix timestamps for joint_states
  metadata.json         # task name, operator, duration, success label

مخطط الحالة المشتركة (22 وصلة × قيمتين لكل منهما)

# joint_states.npy shape: [timesteps, 44]
# Columns: [q0_pos, q0_vel, q1_pos, q1_vel, ..., q21_pos, q21_vel]

# Joint index mapping:
# 0-5:   Left leg (hip_pitch, hip_roll, hip_yaw, knee, ankle_pitch, ankle_roll)
# 6-11:  Right leg (same order)
# 12:    Waist (yaw)
# 13:    Head yaw
# 14:    Head pitch
# 15-21: Left arm (shoulder_pitch, shoulder_roll, shoulder_yaw,
#                   elbow_pitch, wrist_pitch, wrist_roll, wrist_yaw)
# 22-28: Right arm (same order)
# Note: total 29 joints in extended K1 config; base K1 has 22

تسجيل جلسة باستخدام k1_agent.py

# Start the platform agent (streams telemetry to RoboticsCenter)
python k1_agent.py \
  --robot-ip 192.168.10.102 \
  --platform-url https://fearless-backend-533466225971.us-central1.run.app \
  --record \
  --task "pick up red block" \
  --cameras head_cam,left_wrist,right_wrist,external

# Episodes auto-numbered and saved to ./recordings/

تحويل إلى تنسيق LeRobot

python convert_k1_to_lerobot.py \
  --input-dir ./recordings/ \
  --output-dir ./dataset/ \
  --repo-id your-username/k1-pick-place

بروتوكول السلامة أثناء جمع البيانات

  • مطلوب نصاب في جميع الأوقات — يقوم شخص مخصص بمراقبة الروبوت ويحمل نقطة التوقف الإلكترونية. لا يمكن للمشغل عن بعد مراقبة السلامة في وقت واحد.
  • 3 م × 3 م محيط واضح - لا يوجد متفرجون ولا كابلات ولا معدات في منطقة العمليات أثناء أي جلسة مباشرة.
  • حد مدة الحلقة: 60 ثانية - اجعل الحلقات قصيرة. تعد الحلقات الأقصر أسهل في تصفية الجودة وتقليل المخاطر الناجمة عن التشغيل لفترة طويلة.
  • دوران المشغل لمدة 30 دقيقة - قم بتدوير أجهزة التشغيل عن بعد كل 30 دقيقة في جلسات الواقع الافتراضي. يؤدي الإرهاق إلى انخفاض جودة العرض التوضيحي وزيادة معدلات الخطأ.
  • قم بإحباط النظام وإدخاله على الفور في حالة عدم الاستقرار — إذا أظهر K1 أي تذبذب أو انحراف غير متوقع، فاضغط على التوقف الإلكتروني وأعد التشغيل من DAMP. لا تحاول الاستقرار يدويًا.
  • تسجيل جميع الحوادث - قم بتوثيق أي حالات سقوط أو حالات قريبة من السقوط أو حوادث مجهضة. هذه البيانات مفيدة لتصفية جودة مجموعة البيانات ولتحسين إجراءات السلامة.

قائمة التحقق من جودة الحلقة

قم بمراجعة كل حلقة قبل إضافتها إلى مجموعة بيانات التدريب الخاصة بك. سوف تؤدي المظاهرات ذات الجودة الرديئة إلى تدهور سياستك.

  • تم إكمال المهمة بنجاح من البداية إلى النهاية (لا توجد عمليات إكمال جزئية في بيانات التدريب)
  • حافظ الروبوت على توازن مستقر طوال الوقت - دون أي تعثرات أو تذبذبات أو هزات تعويضية
  • تحتوي جميع تدفقات الكاميرا على إطارات كاملة بدون أي أجزاء مسقطة
  • الطوابع الزمنية للحالة المشتركة مستمرة (بدون فجوات> 25 مللي ثانية عند تسجيل 40 هرتز)
  • يكون العرض سلسًا ومتعمدًا - غير متسرع، ولا يتم تصحيحه بشكل مبالغ فيه
  • يكون مشهد الكائن والمهمة مرئيًا في تدفقين للكاميرا على الأقل طوال الوقت
نظرة عامة على خط أنابيب جمع البيانات →

هل أنت مستعد لتدريب أول سياسة خاصة بك تتعلق بالإنسان؟

بمجرد الانتهاء من جمع العروض التوضيحية للجودة، توجه إلى مسار التعلم Booster K1 للحصول على سير عمل التدريب والنشر الكامل.