← Бенчмарки

Тест роботов Google

Оценка манипуляций в реальном мире. 700+ задач, несколько вариантов робота.

Обзор

Google Robot Benchmark оценивает политику в отношении реальных физических роботов при выполнении более 700 задач. Поддерживает WidowX и другие варианты. Показатели включают в себя уровень успеха, производительность в режиме многозадачности и языковую подготовку. Используется для оценки OpenVLA, RT-X и связанных моделей.

Ключевые результаты

  • InternVLA-M1: 71,7% (WidowX), 76–81% (другие варианты реализации)
  • OpenVLA: превосходит RT-2-X на 16,5% в 29 задачах

Связанный