Benchmarks de Aprendizaje de Robots

Evaluación estandarizada para la manipulación de robots — RLBench, LIBERO, CALVIN y más. Tasas de éxito, finalización de tareas, métricas de evaluación.

Colección

Pista de Benchmark de Simulación

Conjuntos de tareas para evaluación reproducible basada en simulación.

Colección

Evaluación de Robots Reales

Benchmarks centrados en el despliegue incorporado y la robustez.

Colección

Tareas Condicionadas por Lenguaje

Benchmarks que enfatizan el anclaje de instrucciones y la composición de tareas.

Navegación Rápida

Categorías Populares

Etiquetas Rápidas

Etiquetas Populares

Evaluación

Referencias para Manipulación

Filtrar conjuntos de referencia por entorno y enfoque de evaluación.

Simulación

RLBench

Más de 100 tareas de manipulación en PyRep. Ampliamente utilizado para la evaluación de VLA. BridgeVLA 88.2%, InternVLA 95%+ en subconjuntos.

Ver referencia → Simulación

LIBERO

Referencia de aprendizaje continuo. 130 tareas, conjuntos espaciales/objetos/objetivos. RoboSuite. 95.9% SOTA (InternVLA).

Ver referencia → Simulación

CALVIN

Composición de Acciones a partir de Lenguaje y Visión. Horizonte largo, condicionado por lenguaje. RoboFlamingo fuerte base.

Ver referencia → robots reales

Google Robot Benchmark

Manipulación en el mundo real. Más de 700 tareas. WidowX, varias encarnaciones. Tasa de éxito, evaluación multi-tarea.

Ver referencia → robots reales

COLOSSEUM

Referencia de robot real a gran escala. Tareas y entornos diversos. BridgeVLA 64%.

Ver referencia →

Activos Vinculados

Modelos y Conjuntos de Datos Sugeridos

Métricas Comparables

Las referencias se agrupan para verificaciones de rendimiento comparables.

Cobertura real versus sí

Evaluar tanto configuraciones controladas como orientadas a la implementación.

Mapeo de Modelos

Cada ruta de referencia se vincula a familias de modelos compatibles.

Soporte de Ejecución

Soporte para captura de datos y operaciones de evaluación cuando sea necesario.

¿Necesita Evaluación o Datos para Su Referencia?

Proporcionamos soporte para la recolección de datos y evaluación en el mundo real.

Servicios de Datos Contáctanos