CALVIN
Compondo Ações a partir de Linguagem e Visão — manipulação condicionada por linguagem em longos horizontes.
Visão Geral
O CALVIN avalia a manipulação condicionada por linguagem ao longo de longos horizontes. Os agentes devem compor múltiplas habilidades a partir de instruções em linguagem natural. Baseado em simulação. RoboFlamingo e outras políticas baseadas em VLM mostram forte desempenho.
Links Oficiais
- github.com/mees/calvin — Código e conjunto de dados