COLOSSEUM

大规模真实机器人操纵基准。多样化的任务和环境。

概述

COLOSSEUM 是一个真实的机器人基准测试，具有跨多种环境的多种操作任务。用于评估 VLA 和策略模型的泛化性和鲁棒性。 BridgeVLA 取得了 64% 的成功。