← 基准测试
真实世界的操纵评估。 700 多个任务,多个机器人实施例。
Google 机器人基准评估了 700 多项任务中真实物理机器人的策略。 支持WidowX和其他实施例。 指标包括成功率、多任务表现和语言基础。 用于评估 OpenVLA、RT-X 和相关模型。