Политика распространения
Обучение зрительно-моторной политике посредством условного шумоподавления. Колумбийский университет.
Обзор
Политика распространения представляет поведение робота как процесс диффузии условного шумоподавления. Он обрабатывает мультимодальные распределения действий, многомерные пространства действий и демонстрирует высокую стабильность при обучении. Среднее улучшение на +46,9% по сравнению с предыдущими методами при выполнении 15 задач манипуляции.
Архитектура
- Отступающий контроль горизонта
- Визуальное кондиционирование
- Диффузионные трансформаторы временных рядов
- МЖРР 2024
Официальные ссылки
- diffusion-policy.cs.columbia.edu — Сайт проекта
- github.com/columbia-ai-robotics/diffusion_policy — Код, дата, столбец
Цитирование
IJRR 2024. См. сайт проекта BibTeX.