← Modelos

Política de Difusión

Aprendizaje de política visuomotora a través de difusión de denoising condicional. Universidad de Columbia.

Resumen

La Política de Difusión representa el comportamiento del robot como un proceso de difusión de denoising condicional. Maneja distribuciones de acción multimodal, espacios de acción de alta dimensión y exhibe una fuerte estabilidad en el entrenamiento. Mejora promedio del +46.9% sobre métodos anteriores en 15 tareas de manipulación.

Arquitectura

  • Control de horizonte decreciente
  • Condicionamiento visual
  • Transformadores de difusión de series temporales
  • IJRR 2024

Enlaces Oficiales

cita

IJRR 2024. Consulte el sitio del proyecto para BibTeX.