Politique de diffusion
Apprentissage des politiques visuomotrices via diffusion de débruitage conditionnelle. Université de Colombie.
Aperçu
La politique de diffusion représente le comportement du robot comme un processus de diffusion de débruitage conditionnel. Il gère les distributions d'actions multimodales, les espaces d'action de grande dimension et présente une forte stabilité d'entraînement. Amélioration moyenne de +46,9 % par rapport aux méthodes précédentes sur 15 tâches de manipulation.
Architecture
- Contrôle de l'horizon fuyant
- Conditionnement visuel
- Transformateurs de diffusion en série chronologique
- IJRR 2024
Liens officiels
- diffusion-policy.cs.columbia.edu — Site du projet
- github.com/columbia-ai-robotics/diffusion_policy — Code, date, Col
Citation
IJRR 2024. Voir le site du projet pour BibTeX.