Mejores Conjuntos de Datos de Aprendizaje de Robots 2025
Una guía curada de los principales conjuntos de datos de código abierto para el aprendizaje por imitación, ajuste fino de VLA e investigación sobre el aprendizaje de robots.
De datos públicos a una señal entrenable
Mejores conjuntos de datos para el aprendizaje de robots
Elegir el conjunto de datos adecuado depende de su robot, tarea y modelo. Aquí están los conjuntos de datos más utilizados en 2025.
1. Open X-Embodiment
Combina RT-X, BridgeData, DROID y otros en un formato unificado. Se utiliza para entrenar modelos base como OpenVLA y Octo. Mejor para: pre-entrenar políticas generalistas. Ver Open X-Embodiment.
2. DROID
Manipulación a gran escala y diversa de 22 tipos de robots. 76K trayectorias. Mejor para: generalización multi-robot, entrenamiento de modelos base. Ver DROID.
3. BridgeData
Manipulación de WidowX en 60 tareas. Ampliamente utilizado en investigación. Mejor para: manipulación de un solo brazo, compatibilidad con WidowX. Ver BridgeData.
4. Conjuntos de datos ALOHA / Stanford
Teleoperación bimanual. Manipulación en cocina y móvil. Mejor para: tareas bimanuales, Mobile ALOHA. Ver ALOHA.
5. LeRobot
Conjuntos de datos de la comunidad alojados en Hugging Face. Fácil de agregar los tuyos. Mejor para: experimentos rápidos, compartir datos. Ver LeRobot.
Cómo Elegir
- ¿El mismo robot que el conjunto de datos? Usa ese conjunto de datos (por ejemplo, WidowX → BridgeData).
- ¿Robot diferente? Abre X-Embodiment o DROID para transferencia multi-robot.
- ¿Tarea personalizada? Recoge el tuyo o usa nuestros servicios de datos.
Catálogo completo
Ver nuestro completo Catálogo de conjuntos de datos con enlaces a todos los conjuntos de datos, documentos y páginas de descarga.