COLOSSEUM
Benchmark de manipulación de robots reales a gran escala. Tareas y entornos diversos.
Resumen
COLOSSEUM es un benchmark de robots reales con diversas tareas de manipulación en múltiples entornos. Se utiliza para evaluar la generalización y robustez de modelos VLA y de políticas. BridgeVLA logra un 64% de éxito.
Relacionado
- BridgeVLA — 64% y COLISEO