Meilleurs ensembles de données d’apprentissage des robots 2025

Un guide organisé des principaux ensembles de données open source pour l'apprentissage par imitation, le réglage fin du VLA et la recherche sur l'apprentissage des robots.

Des données publiques à un signal entraînable

Agrégat Vicaire Référence Ancienne

Principaux ensembles de données pour l'apprentissage des robots

Le choix du bon ensemble de données dépend de votre robot, de votre tâche et de votre modèle. Voici les ensembles de données les plus utilisés en 2025.

1. Ouvrez X-Embodiment

Combine RT-X, BridgeData, DROID et autres dans un format unifié. Utilisé pour former des modèles de fondation comme OpenVLA et Octo. Idéal pour : les politiques généralistes de pré-formation. Voir Ouvrir l'incarnation X.

2. DROÏDE

Manipulation diversifiée à grande échelle à partir de 22 types de robots. 76 000 trajectoires. Idéal pour : la généralisation multi-robots, la formation de modèles de base. Voir DROID.

3. BridgeData

Manipulation de WidowX sur 60 tâches. Largement utilisé dans la recherche. Idéal pour : manipulation à un seul bras, compatibilité WidowX. Voir BridgeData.

4. Ensembles de données ALOHA / Stanford

Téléopération bimanuelle. Cuisine, manipulation mobile. Idéal pour : tâches bimanuelles, Mobile ALOHA. Voir ALOHA.

5. LeRobot

Ensembles de données communautaires hébergés par Hugging Face. Facile d’ajouter le vôtre. Idéal pour : expériences rapides, partage de données. Voir LeRobot.

Comment choisir

Même robot que l’ensemble de données ? Utilisez cet ensemble de données (par exemple, WidowX → BridgeData).
Un autre robot ? Ouvrez X-Embodiment ou DROID pour un transfert multi-robot.
Tâche personnalisée ? Collectionnez le vôtre ou utilisez-le nos services de données.

Catalogue complet

Voir notre complet Catalogue de jeux de données avec des liens vers tous les ensembles de données, articles et pages de téléchargement.

Afficher tous les ensembles de données →