RLBベンチ
PyRep には 100 以上の操作タスクがあります。 VLA およびポリシー評価の標準ベンチマーク。
概要
RLBench は、PyRep (CoppeliaSim) シミュレーション環境に大規模な操作タスクのセットを提供します。 タスクには、ピックプレイス、積み重ね、引き出しを開けるなどが含まれます。 視覚・言語・行動モデルと視覚運動ポリシーを評価するために広く使用されています。
主な結果 (最近)
- BridgeVLA: 88.2% 成功
- InternVLA-M1: サブセットで 95%+
公式リンク
- github.com/stepjam/RLBench — コードとタスク