データフライホイール
ロボットの学習ポリシーを改善する最も信頼できる方法は、モデルを変更することではなく、データを改善することです。 データ フライホイールは、本格的なロボット学習プロジェクトの中核となる反復ループです。
評価する
20 回のトライアルを実行します。 成功率を測定します。 障害をタイプ別に分類します。 これはユニット 5 で行いました。
主な故障モードを特定する
それはデータの品質 (一貫性のないデモ)、分布の変化 (目に見えない位置)、またはモデルの能力 (十分に正確な軌道だが間違っている) なのでしょうか? あなたのユニット 5 の診断がこれに答えます。
対象となるデータを収集する
特に障害状況をカバーする 20 ~ 30 件のデモンストレーションを記録します。 ワークスペースの左側にあるオブジェクトでポリシーが失敗した場合は、その特定の位置のデモを 20 個記録します。 すでに動作しているものをさらに記録しないでください。
再トレーニングと再評価
新しいデータを既存のデータセットと結合し、再トレーニングして、20 トライアル評価を再度実行します。 診断が正しければ、サイクルごとに 10 ~ 20 パーセント ポイントの改善が期待されます。
データセットの混合
LeRobot は複数のデータセットで同時にトレーニングできるため、対象のコレクション データを元のデータセットと組み合わせたり、同じタスクやロボット タイプのパブリック コミュニティ データセットと組み合わせたりする場合に役立ちます。
info.json 混合する予定のデータセットの。
HuggingFace Hub でモデルを共有する
トレーニングされたモデルを共有すると、そのモデルがコミュニティで利用できるようになり、他の人が開始点としてポリシーを使用できるようになります。 標準 LeRobot 形式で共有されたモデルは、誰でも直接ロードできます。 pip install lerobot.
データセットをコミュニティと共有する
データセット (ユニット 3 でプッシュしたもの) はすでに HuggingFace Hub 上にあります。 他の人にとってより見つけやすく、役立つようにするには:
- 追加 データセットカード HuggingFace では、タスク、ロボット、録画セットアップ、エピソード数について説明します。 これは、データセットを見つけやすくするために実行できる唯一の最も影響力のあることです。
- タグ付けしてください
lerobot、ロボットのタイプ (例:so100)、およびタスクのカテゴリ (例:pick-and-place). - に提出してください SVRC データセット ライブラリ キュレーションとコミュニティ インデックスへの登録を目的としています。
LeRobot へのハードウェア構成の提供
ユニット 1 でサポートされていないロボットのカスタム ハードウェア構成を追加した場合は、それを LeRobot リポジトリに戻すことを検討してください。 プルリクエストを開くと、 huggingface/lerobot 設定ファイルを使用して lerobot/configs/robot/。 メンテナはハードウェアの貢献を迅速にレビューし、これはそのハードウェアの将来のすべてのユーザーに直接利益をもたらします。
次は何ですか: より有効なポリシー
これで、完全な LeRobot ワークフローが完成しました。 ここからの行き先は次のとおりです。