← 基准测试

RLBench

PyRep 中有 100 多个操作任务。 VLA 和政策评估的标准基准。

概述

RLBench 在 PyRep (CoppeliaSim) 模拟环境中提供了大量的操作任务。 任务包括拾取、堆叠、打开抽屉等。 广泛用于评估视觉-语言-动作模型和视觉运动策略。

主要结果(最新)

  • BridgeVLA:88.2% 成功
  • InternVLA-M1:子集 95%+

官方链接