CALVIN
Composer des actions à partir du langage et de la vision – manipulation à long terme conditionnée par le langage.
Aperçu
CALVIN évalue la manipulation conditionnée par le langage sur de longs horizons. Les agents doivent composer plusieurs compétences à partir d'instructions en langage naturel. Basé sur la simulation. RoboFlamingo et d'autres politiques basées sur VLM affichent de solides performances.
Liens officiels
- github.com/mees/calvin — Code et ensemble de données