COLOSSEUM
Benchmark de manipulação de robôs reais em grande escala. Tarefas e ambientes diversos.
Visão Geral
COLOSSEUM é um benchmark de robôs reais com diversas tarefas de manipulação em múltiplos ambientes. Usado para avaliar a generalização e robustez de modelos VLA e de políticas. BridgeVLA alcança 64% de sucesso.
Relacionado
- BridgeVLA — 64% sem COLOSSEUM