意味
トランスベースのポリシーは、ロボット制御にアテンション メカニズムを適用します。 統一されたシーケンス モデルを通じて、画像、固有受容、言語指示、行動履歴といった異種入力を処理できます。 主要なアーキテクチャには、RT-1 (EfficientNet ビジョンによるトークン化されたアクション)、RT-2 (VLM バックボーン)、ACT (バイマニュアル制御用のアクション チャンキング トランスフォーマー)、および Octo (スケーラブルなクロス実施形態トランスフォーマー) が含まれます。 トランスフォーマーは、可変長コンテキストとマルチタスク コンディショニングを自然に処理します。 ロボット工学における主な課題は推論のレイテンシです。10 ~ 50 Hz でのリアルタイム制御には、コンピューティングを償却するための効率的なモデル設計またはアクションのチャンク化が必要です。
ロボットチームにとってそれが重要な理由
変圧器ポリシーを理解することは、現実世界のロボット システムを構築するチームにとって不可欠です。 デモンストレーション データを収集する場合でも、シミュレーションでポリシーをトレーニングする場合でも、運用環境に展開する場合でも、この概念はワークフローとシステム設計に直接影響します。