← Modèles

Politique de diffusion

Apprentissage des politiques visuomotrices via diffusion de débruitage conditionnelle. Université de Colombie.

Aperçu

La politique de diffusion représente le comportement du robot comme un processus de diffusion de débruitage conditionnel. Il gère les distributions d'actions multimodales, les espaces d'action de grande dimension et présente une forte stabilité d'entraînement. Amélioration moyenne de +46,9 % par rapport aux méthodes précédentes sur 15 tâches de manipulation.

Architecture

  • Contrôle de l'horizon fuyant
  • Conditionnement visuel
  • Transformateurs de diffusion en série chronologique
  • IJRR 2024

Liens officiels

Citation

IJRR 2024. Voir le site du projet pour BibTeX.