- RVB et profondeurCela reste la base pour les tâches de manipulation basées sur la perception.
- Force et tactileImportant pour les transitions riches en contacts et pour saisir la stabilité.
- Langue et métadonnéesUtile pour la récupération, les tranches d’évaluation et la mise à la terre des instructions.
Ensembles de données de robots multimodaux
Les ensembles de données multimodaux relient la vision, l'action, la proprioception et le toucher afin que les équipes puissent réfléchir sur les informations dont leur politique aura réellement besoin.
Cette page aide les équipes à décider si elles ont besoin de plus de modalités, d'un meilleur alignement du timing ou de métadonnées plus claires avant de se recycler.