← 基准测试

COLOSSEUM

大规模真实机器人操纵基准。 多样化的任务和环境。

概述

COLOSSEUM 是一个真实的机器人基准测试,具有跨多种环境的多种操作任务。 用于评估 VLA 和策略模型的泛化性和鲁棒性。 BridgeVLA 取得了 64% 的成功。

有关的

  • 桥VLA — 64% 认为罗马斗兽场