← المعايير

COLOSSEUM

معيار التلاعب بالروبوت الحقيقي على نطاق واسع. مهام وبيئات متنوعة.

ملخص

يعد COLOSSEUM بمثابة معيار حقيقي للروبوت مع مهام معالجة متنوعة عبر بيئات متعددة. يستخدم لتقييم تعميم وقوة VLA ونماذج السياسة. BridgeVLA يحقق نجاحاً بنسبة 64%.

متعلق ب

  • BridgeVLA — 64% على الكولوسيوم