Política de Difusão
Aprendizado de política visuomotora via difusão condicional de desnoising. Universidade de Columbia.
Visão Geral
A Política de Difusão representa o comportamento do robô como um processo de difusão condicional de desnoising. Ela lida com distribuições de ação multimodais, espaços de ação de alta dimensão e exibe forte estabilidade de treinamento. Melhoria média de +46,9% em relação a métodos anteriores em 15 tarefas de manipulação.
Arquitetura
- Controle de horizonte recuado
- Condicionamento visual
- Transformadores de difusão de séries temporais
- IJRR 2024
Links Oficiais
- diffusion-policy.cs.columbia.edu — Site do projeto
- github.com/columbia-ai-robotics/diffusion_policy — Código, dados, Colab
Citação
IJRR 2024. Veja o site do projeto para BibTeX.