Mejores Conjuntos de Datos de Aprendizaje de Robots 2025

Una guía curada de los principales conjuntos de datos de código abierto para el aprendizaje por imitación, ajuste fino de VLA e investigación sobre el aprendizaje de robots.

De datos públicos a una señal entrenable

Agregar Sanar Referencia Entrenar

Mejores conjuntos de datos para el aprendizaje de robots

Elegir el conjunto de datos adecuado depende de su robot, tarea y modelo. Aquí están los conjuntos de datos más utilizados en 2025.

1. Open X-Embodiment

Combina RT-X, BridgeData, DROID y otros en un formato unificado. Se utiliza para entrenar modelos base como OpenVLA y Octo. Mejor para: pre-entrenar políticas generalistas. Ver Open X-Embodiment.

2. DROID

Manipulación a gran escala y diversa de 22 tipos de robots. 76K trayectorias. Mejor para: generalización multi-robot, entrenamiento de modelos base. Ver DROID.

3. BridgeData

Manipulación de WidowX en 60 tareas. Ampliamente utilizado en investigación. Mejor para: manipulación de un solo brazo, compatibilidad con WidowX. Ver BridgeData.

4. Conjuntos de datos ALOHA / Stanford

Teleoperación bimanual. Manipulación en cocina y móvil. Mejor para: tareas bimanuales, Mobile ALOHA. Ver ALOHA.

5. LeRobot

Conjuntos de datos de la comunidad alojados en Hugging Face. Fácil de agregar los tuyos. Mejor para: experimentos rápidos, compartir datos. Ver LeRobot.

Cómo Elegir

¿El mismo robot que el conjunto de datos? Usa ese conjunto de datos (por ejemplo, WidowX → BridgeData).
¿Robot diferente? Abre X-Embodiment o DROID para transferencia multi-robot.
¿Tarea personalizada? Recoge el tuyo o usa nuestros servicios de datos.

Catálogo completo

Ver nuestro completo Catálogo de conjuntos de datos con enlaces a todos los conjuntos de datos, documentos y páginas de descarga.

Ver Todos los Conjuntos de Datos →