- Politique de diffusionFort pour les données de démonstration de haute qualité et la modélisation de trajectoires.
- ACT / LeRobotUtile pour les boucles d’apprentissage pratiques par imitation.
- Des VLA plus petitsUtile lorsque les données téléop font partie d’une pile plus large conditionnée par le langage.
Modèles pour l’amorçage de la téléopération
Les équipes axées sur la téléopération ont généralement besoin de modèles qui apprennent rapidement des démonstrations, préservent de manière productive les préjugés des opérateurs et exposent clairement les points de défaillance.
Si vous avez besoin de gains rapides à partir d'un ensemble de données téléop ciblées, les politiques d'imitation spécifiques à des tâches surpassent souvent les grands modèles généraux en termes de délai de rentabilisation.