Meilleurs ensembles de données d’apprentissage des robots 2025
Un guide organisé des principaux ensembles de données open source pour l'apprentissage par imitation, le réglage fin du VLA et la recherche sur l'apprentissage des robots.
Des données publiques à un signal entraînable
Principaux ensembles de données pour l'apprentissage des robots
Le choix du bon ensemble de données dépend de votre robot, de votre tâche et de votre modèle. Voici les ensembles de données les plus utilisés en 2025.
1. Ouvrez X-Embodiment
Combine RT-X, BridgeData, DROID et autres dans un format unifié. Utilisé pour former des modèles de fondation comme OpenVLA et Octo. Idéal pour : les politiques généralistes de pré-formation. Voir Ouvrir l'incarnation X.
2. DROÏDE
Manipulation diversifiée à grande échelle à partir de 22 types de robots. 76 000 trajectoires. Idéal pour : la généralisation multi-robots, la formation de modèles de base. Voir DROID.
3. BridgeData
Manipulation de WidowX sur 60 tâches. Largement utilisé dans la recherche. Idéal pour : manipulation à un seul bras, compatibilité WidowX. Voir BridgeData.
4. Ensembles de données ALOHA / Stanford
Téléopération bimanuelle. Cuisine, manipulation mobile. Idéal pour : tâches bimanuelles, Mobile ALOHA. Voir ALOHA.
5. LeRobot
Ensembles de données communautaires hébergés par Hugging Face. Facile d’ajouter le vôtre. Idéal pour : expériences rapides, partage de données. Voir LeRobot.
Comment choisir
- Même robot que l’ensemble de données ? Utilisez cet ensemble de données (par exemple, WidowX → BridgeData).
- Un autre robot ? Ouvrez X-Embodiment ou DROID pour un transfert multi-robot.
- Tâche personnalisée ? Collectionnez le vôtre ou utilisez-le nos services de données.
Catalogue complet
Voir notre complet Catalogue de jeux de données avec des liens vers tous les ensembles de données, articles et pages de téléchargement.