Política de Difusión

Aprendizaje de política visuomotora a través de difusión de denoising condicional. Universidad de Columbia.

Resumen

La Política de Difusión representa el comportamiento del robot como un proceso de difusión de denoising condicional. Maneja distribuciones de acción multimodal, espacios de acción de alta dimensión y exhibe una fuerte estabilidad en el entrenamiento. Mejora promedio del +46.9% sobre métodos anteriores en 15 tareas de manipulación.

Arquitectura

Control de horizonte decreciente
Condicionamiento visual
Transformadores de difusión de series temporales
IJRR 2024

Enlaces Oficiales

diffusion-policy.cs.columbia.edu — Sitio del proyecto
github.com/columbia-ai-robotics/diffusion_policy — Código, datos, Colab

cita

IJRR 2024. Consulte el sitio del proyecto para BibTeX.