ロボットデモンストレーションデータ品質チェックリスト

データ量よりもデータ品質が重要な理由

1,000 件の高品質で多様なデモンストレーションのデータセットは、多くの場合、10,000 件のノイズの多いデモンストレーションよりもパフォーマンスが優れています。品質の問題 (センサーの非同期、アクションの不連続、成功と混合したタスクの失敗、一貫性のないラベル付け) は、トレーニングされたポリシーに伝播し、謎の展開エラーを引き起こします。

15 項目の品質チェックリスト

トレーニングセットに追加する前に、収集したエピソードのすべてのバッチにこれらのチェックを適用します。

センサーのタイムスタンプは 10ms 以内に同期されます
カメラフレームのドロップなし (フレーム数と継続時間を確認)
物理的な関節制限内のアクション値
平均ステップサイズから 2σ を超えるアクションの不連続性はありません
2 番目のレビュー担当者によって検証された成功/失敗のラベル
タスクは予想される期間内に完了しました
最終的なデータセットではオペレーターによる自己修正はありません
重要な段階でカメラが遮られない
固有受容は命令された行動と一致する
グリッパーの状態は適切なタイミングで遷移します
重複したエピソードはありません
メタデータフィールドが完了しました (タスク ID、オペレーター、日付)
ターゲット形式で保存されたエピソード (RLDS/LeRobot)
予想される分布内のバッチ統計
ランダムサンプルを目視でスポットチェック

ロボットデモンストレーションデータ品質チェックリスト

データ量よりもデータ品質が重要な理由

15 項目の品質チェックリスト

関連ページ

すべての研究論文

製品を閲覧する

ロボットアカデミー

お問い合わせ

ロボット デモンストレーション データ品質チェックリスト

データ量よりもデータ品質が重要な理由

15 項目の品質チェックリスト

関連ページ

すべての研究論文

製品を閲覧する

ロボットアカデミー

お問い合わせ

ロボットデモンストレーションデータ品質チェックリスト