COLOSSEUM

대규모 실제 로봇 조작 벤치마크. 다양한 작업과 환경.

개요

COLOSSEUM은 여러 환경에서 다양한 조작 작업을 수행하는 실제 로봇 벤치마크입니다. VLA 및 정책 모델의 일반화 및 견고성을 평가하는 데 사용됩니다. BridgeVLA는 64%의 성공을 달성했습니다.