← 基准测试

谷歌机器人基准测试

真实世界的操纵评估。 700 多个任务,多个机器人实施例。

概述

Google 机器人基准评估了 700 多项任务中真实物理机器人的策略。 支持WidowX和其他实施例。 指标包括成功率、多任务表现和语言基础。 用于评估 OpenVLA、RT-X 和相关模型。

主要结果

  • InternVLA-M1:71.7% (WidowX)、76–81%(其他实施例)
  • OpenVLA:在 29 项任务上比 RT-2-X 性能高出 16.5%

有关的