Définition
En robotique, les modèles de base font référence à de grands réseaux de neurones pré-entraînés sur de vastes ensembles de données (images Internet, textes ou données de robots inter-incarnations) qui fournissent des représentations générales transférables à des tâches spécifiques. Les modèles Vision-Langage-Action (VLA) comme RT-2, OpenVLA et π₀ en sont des exemples. Ces modèles acceptent les instructions linguistiques et les observations visuelles pour produire des actions de robot. Le principal avantage réside dans la réduction des besoins en données pour les nouvelles tâches, car les représentations pré-entraînées capturent déjà des concepts visuels et sémantiques utiles.
Pourquoi c'est important pour les équipes de robots
Comprendre le modèle de base est essentiel pour les équipes qui construisent des systèmes robotiques réels. Que vous collectiez des données de démonstration, formiez des politiques en simulation ou déployiez en production, ce concept affecte directement votre flux de travail et la conception de votre système.