両手によるデータ収集が難しい理由
シングルアームのデータ収集では、悪いデモンストレーションは 1 つのアームの軌道にのみ影響します。 50 個のデモを記録し、5 個の悪いデモを破棄し、45 個でトレーニングします。手動によるデータ収集では、引き継ぎ時点でのミスにより無効になります。 両方 そのデモの腕の軌道を同時に確認します。 故障モードは結合されています。
この結合には 2 つの実際的な意味があります。 まず、より多くのデモンストレーション (50 ではなく 100) が必要です。これは、両手タスクの分散が大きく、調整構造を学習するためにポリシーにより多くの例が必要であるためです。 次に、デモンストレーションごとに厳密な一貫性が必要です。 一貫性が 80% のシングルアーム デモは、かなり適切にトレーニングされます。 一方のアームが一貫していて、もう一方のアームが変化するバイマニュアルのデモでは、調整のタイミングについてポリシーに何も役に立ちません。
ワークスペースをカバーするという課題もさらに大きくなります。両腕をフレーム内に収める必要があり、最も複雑な瞬間であるハンドオフ ポイントを少なくとも 1 台のカメラで確実に捉える必要があります。 開始する前にカメラの角度を確認し、ワークスペースのカメラの視野外でハンドオフが発生するかどうかを調整してください。
LeRobot バイマニュアル データセット形式
DK1 と LeRobot の統合により、標準のシングルアーム形式がデュアルジョイントステートアレイで拡張されます。 データセット内の各タイムステップには以下が含まれます。
シングルアームとの主な違いは、アクション空間が 14 次元 (6+6 ジョイント + 2 グリッパー) であることです。 ACT はこれをネイティブに処理します。トレーニング構成でアクション ディメンションを指定すると、他の変更は必要ありません。
録音ワークフロー
記録セッションを開始する前に 10 ~ 15 回の練習デモを実行して、タスクに備えて運動記憶をウォームアップします。 最初の 5 ~ 10 個の録音デモは最悪の結果になるでしょう - それは予想通りです。 セッション中に立ち止まって確認しないでください。 100 個すべてが記録された後、レビューして悪いデモを選別します。
バイマニュアルデータの品質チェックリスト
LeRobot のリプレイ ビューアを使用して、録画後にすべてのデモを確認します。 次の基準を 2 つ以上満たさないデモは破棄します。
ユニット 4 が完了したら...
LeRobot 形式で録画されたデモンストレーションが 100 件あります。 ~/dk1-datasets/cube-handoff-v1/。 レビューと選別の後、少なくとも 90 個のデモが品質チェックリストに合格します。 両方の関節状態配列は、エピソードごとに 50Hz で存在します。 両方のカメラ フィードが存在し、ハンドオフの瞬間を含む完全なタスク シーケンスが表示されます。 あなたは走りました python -m lerobot.scripts.visualize_dataset --repo-id cube-handoff-v1 データセット構造が有効であることを確認しました。