← Repères

CALVIN

Composer des actions à partir du langage et de la vision – manipulation à long terme conditionnée par le langage.

Aperçu

CALVIN évalue la manipulation conditionnée par le langage sur de longs horizons. Les agents doivent composer plusieurs compétences à partir d'instructions en langage naturel. Basé sur la simulation. RoboFlamingo et d'autres politiques basées sur VLM affichent de solides performances.

Liens officiels