意味

行動クローニング (BC) は、模倣学習への最も簡単なアプローチです。 ニューラル ネットワークは、専門家のデモンストレーションのデータセットに対する教師あり学習を使用して、観察をアクションに直接マッピングするようにトレーニングされます。 BC は実装が簡単ですが、エージェントがトレーニング中には見ら​​れなかった状態に遭遇するため、実行中に複合エラーが発生する可能性があります。 DAgger (データセット集約) のような技術は、修正ラベルを繰り返し収集することでこの問題に対処します。 BC は依然としてロボット操作における強力なベースラインであり、多くの場合、チームが新しいハードウェアやデータセットを評価するときに最初に試行する方法です。

ロボットチームにとってそれが重要な理由

動作のクローン作成を理解することは、現実世界のロボット システムを構築するチームにとって不可欠です。 デモンストレーション データを収集する場合でも、シミュレーションでポリシーをトレーニングする場合でも、運用環境に展開する場合でも、この概念はワークフローとシステム設計に直接影響します。