Politique de diffusion

Apprentissage des politiques visuomotrices via diffusion de débruitage conditionnelle. Université de Colombie.

Aperçu

La politique de diffusion représente le comportement du robot comme un processus de diffusion de débruitage conditionnel. Il gère les distributions d'actions multimodales, les espaces d'action de grande dimension et présente une forte stabilité d'entraînement. Amélioration moyenne de +46,9 % par rapport aux méthodes précédentes sur 15 tâches de manipulation.

Architecture

Contrôle de l'horizon fuyant
Conditionnement visuel
Transformateurs de diffusion en série chronologique
IJRR 2024

Liens officiels

diffusion-policy.cs.columbia.edu — Site du projet
github.com/columbia-ai-robotics/diffusion_policy — Code, date, Col

Citation

IJRR 2024. Voir le site du projet pour BibTeX.