Política de Difusão

Aprendizado de política visuomotora via difusão condicional de desnoising. Universidade de Columbia.

Visão Geral

A Política de Difusão representa o comportamento do robô como um processo de difusão condicional de desnoising. Ela lida com distribuições de ação multimodais, espaços de ação de alta dimensão e exibe forte estabilidade de treinamento. Melhoria média de +46,9% em relação a métodos anteriores em 15 tarefas de manipulação.

Arquitetura

Controle de horizonte recuado
Condicionamento visual
Transformadores de difusão de séries temporais
IJRR 2024

Links Oficiais

diffusion-policy.cs.columbia.edu — Site do projeto
github.com/columbia-ai-robotics/diffusion_policy — Código, dados, Colab

Citação

IJRR 2024. Veja o site do projeto para BibTeX.