COLOSSEUM
Масштабный тест манипулирования реальными роботами. Разнообразные задачи и окружение.
Обзор
COLOSSEUM — это настоящий тест роботов с разнообразными задачами манипулирования в различных средах. Используется для оценки обобщения и надежности моделей VLA и политик. BridgeVLA достигает 64% успеха.
Связанный
- МостВЛА — 64% на КОЛИЗЕЙ