COLOSSEUM

Benchmark de manipulación de robots reales a gran escala. Tareas y entornos diversos.

Resumen

COLOSSEUM es un benchmark de robots reales con diversas tareas de manipulación en múltiples entornos. Se utiliza para evaluar la generalización y robustez de modelos VLA y de políticas. BridgeVLA logra un 64% de éxito.

Relacionado

BridgeVLA — 64% y COLISEO