← ベンチマーク

RLBベンチ

PyRep には 100 以上の操作タスクがあります。 VLA およびポリシー評価の標準ベンチマーク。

概要

RLBench は、PyRep (CoppeliaSim) シミュレーション環境に大規模な操作タスクのセットを提供します。 タスクには、ピックプレイス、積み重ね、引き出しを開けるなどが含まれます。 視覚・言語・行動モデルと視覚運動ポリシーを評価するために広く使用されています。

主な結果 (最近)

  • BridgeVLA: 88.2% 成功
  • InternVLA-M1: サブセットで 95%+

公式リンク