← Benchmarks

CALVIN

Compondo Ações a partir de Linguagem e Visão — manipulação condicionada por linguagem em longos horizontes.

Visão Geral

O CALVIN avalia a manipulação condicionada por linguagem ao longo de longos horizontes. Os agentes devem compor múltiplas habilidades a partir de instruções em linguagem natural. Baseado em simulação. RoboFlamingo e outras políticas baseadas em VLM mostram forte desempenho.

Links Oficiais