COLOSSEUM

Benchmark de manipulação de robôs reais em grande escala. Tarefas e ambientes diversos.

Visão Geral

COLOSSEUM é um benchmark de robôs reais com diversas tarefas de manipulação em múltiplos ambientes. Usado para avaliar a generalização e robustez de modelos VLA e de políticas. BridgeVLA alcança 64% de sucesso.

Relacionado

BridgeVLA — 64% sem COLOSSEUM