← Бенчмарки

COLOSSEUM

Масштабный тест манипулирования реальными роботами. Разнообразные задачи и окружение.

Обзор

COLOSSEUM — это настоящий тест роботов с разнообразными задачами манипулирования в различных средах. Используется для оценки обобщения и надежности моделей VLA и политик. BridgeVLA достигает 64% успеха.

Связанный