ブースターK1

データ収集

ヒューマノイドのデータ収集は、アームのみのワークフローとは根本的に異なります。 K1 は 22 以上の自由度を持ち、遠隔操作中にバランスを維持する必要があり、同期されたマルチモーダルキャプチャが必要です。このページでは、課題、手法、データセット形式、安全プロトコルについて説明します。

なぜ違うのか

ヒューマノイドのデータ収集の課題

フルサイズのヒューマノイドで高品質のデモンストレーションを収集するには、デスクトップアームには存在しない課題に対処する必要があります。

⚖

遠隔操作中のバランス

K1 は、オペレーターが腕を制御している間、全身のバランスを維持する必要があります。腕の動きにより重心が移動するため、移動コントローラーが継続的に補正する必要があります。アームコマンドを急速に使用すると、ロボットが不安定になる可能性があります。

📊

高次元状態

全身の関節状態には、22 DOF と IMU、頭のポーズ、およびオプションの手の状態が含まれており、タイムステップごとに 30 以上の次元が含まれます。データセットファイルは、arm のみのデータセットよりも大幅に大きくなります。ストレージ計画は不可欠です。

📷

マルチカメラ同期

ヒューマノイドのタスクには通常、自己中心性 (頭部装着型) カメラと外中心性 (外部) カメラが必要です。複数のビデオストリームを 50 Hz 以上のジョイントテレメトリと同期するには、慎重なパイプライン設計が必要です。

👥

オペレータの疲労

VR ベースの全身遠隔操作は肉体的に負担がかかります。オペレーターあたり 30 分を超えるセッションは、デモンストレーションの品質を大幅に低下させます。長期にわたる回収キャンペーンではオペレーターのローテーションを計画します。

ロボットの制御方法

ヒューマノイドの遠隔操作方法

上半身の遠隔操作では 2 つの主な方法がサポートされています。移動は常にゲームパッドからの速度コマンドによって、または自律的に制御されます。

VR全身遠隔操作推奨

Meta Quest 3 または同様の VR ヘッドセットを使用して、オペレーターの頭と手のポーズを追跡します。 K1 の頭と腕のジョイントは、オペレーターの動きをリアルタイムで反映します。最も自然で表現力豊かなデモンストレーションを提供します。

設定： Quest 3 + SteamVR、k1_vr_teleop ROS2 ノード、オペレーターはハンドトラッキングのために手袋を着用します。

レイテンシ: ヘッドは最大 20 ミリ秒、アームはエンドツーエンドで最大 40 ミリ秒。

以下に最適: マニピュレーションタスク、ピックアンドプレイス、全身のロコマニピュレーション。

リーダー・フォロワーの上半身高度な

2 番目の人間スケールの外骨格またはリーダーアームシステムは、フォロワー K1 の上半身を反映しています。ジョイント角度は、リーダーからフォロワーに直接マッピングされます。 VR ハードウェアは必要ありません。

設定： 互換性のあるリーダーアームシステム (OpenArm 両手キットやカスタム外骨格など) が必要です。パートナー構成については SVRC にお問い合わせください。

以下に最適: 追跡精度が重要な場合の正確な両手操作。

遠隔操作中の移動

上半身の遠隔操作は通常、ゲームパッドで制御される移動と組み合わせられます。オペレーターはワイヤレスゲームパッドを使用して歩行速度を指示し、VR システムは腕と頭を制御します。

# Launch combined teleop: VR for upper body + gamepad for locomotion
ros2 launch k1_teleop k1_combined_teleop.launch.py \
  vr_device:=quest3 \
  gamepad:=xbox \
  robot_ip:=192.168.10.102

データ形式

全身データセット形式 (30+ DoF)

各エピソードは、同期された関節状態、カメラフレーム、メタデータを記録します。この形式は LeRobot および HuggingFace データセットと互換性があります。

エピソードの構成

episode_000001/
  joint_states.npy      # [T, 44] — positions, velocities, torques for 22 joints
  imu.npy               # [T, 6]  — accel (3) + gyro (3) from torso IMU
  head_pose.npy         # [T, 2]  — yaw and pitch in radians
  head_cam.mp4          # 1280x720 @ 30 fps, head-mounted egocentric
  left_cam.mp4          # 1280x720 @ 30 fps, left wrist
  right_cam.mp4         # 1280x720 @ 30 fps, right wrist
  external_cam.mp4      # 1920x1080 @ 30 fps, fixed external view
  timestamps.npy        # [T] unix timestamps for joint_states
  metadata.json         # task name, operator, duration, success label

ジョイント状態スキーマ (22 ジョイント × それぞれ 2 つの値)

# joint_states.npy shape: [timesteps, 44]
# Columns: [q0_pos, q0_vel, q1_pos, q1_vel, ..., q21_pos, q21_vel]

# Joint index mapping:
# 0-5:   Left leg (hip_pitch, hip_roll, hip_yaw, knee, ankle_pitch, ankle_roll)
# 6-11:  Right leg (same order)
# 12:    Waist (yaw)
# 13:    Head yaw
# 14:    Head pitch
# 15-21: Left arm (shoulder_pitch, shoulder_roll, shoulder_yaw,
#                   elbow_pitch, wrist_pitch, wrist_roll, wrist_yaw)
# 22-28: Right arm (same order)
# Note: total 29 joints in extended K1 config; base K1 has 22

k1_agent.py を使用したセッションの記録

# Start the platform agent (streams telemetry to RoboticsCenter)
python k1_agent.py \
  --robot-ip 192.168.10.102 \
  --platform-url https://fearless-backend-533466225971.us-central1.run.app \
  --record \
  --task "pick up red block" \
  --cameras head_cam,left_wrist,right_wrist,external

# Episodes auto-numbered and saved to ./recordings/

LeRobot形式に変換する

python convert_k1_to_lerobot.py \
  --input-dir ./recordings/ \
  --output-dir ./dataset/ \
  --repo-id your-username/k1-pick-place

必読