← ベンチマーク

CALVIN

言語と視覚からアクションを構成する — 長期的な言語条件付き操作。

概要

CALVIN は、言語条件付き操作を長期にわたって評価します。 エージェントは自然言語の指示から複数のスキルを作成する必要があります。 シミュレーションベース。 RoboFlamingo およびその他の VLM ベースのポリシーは、優れたパフォーマンスを示します。

公式リンク