← Modelos

Política de Difusão

Aprendizado de política visuomotora via difusão condicional de desnoising. Universidade de Columbia.

Visão Geral

A Política de Difusão representa o comportamento do robô como um processo de difusão condicional de desnoising. Ela lida com distribuições de ação multimodais, espaços de ação de alta dimensão e exibe forte estabilidade de treinamento. Melhoria média de +46,9% em relação a métodos anteriores em 15 tarefas de manipulação.

Arquitetura

  • Controle de horizonte recuado
  • Condicionamento visual
  • Transformadores de difusão de séries temporais
  • IJRR 2024

Links Oficiais

Citação

IJRR 2024. Veja o site do projeto para BibTeX.