Политика распространения

Обучение зрительно-моторной политике посредством условного шумоподавления. Колумбийский университет.

Обзор

Политика распространения представляет поведение робота как процесс диффузии условного шумоподавления. Он обрабатывает мультимодальные распределения действий, многомерные пространства действий и демонстрирует высокую стабильность при обучении. Среднее улучшение на +46,9% по сравнению с предыдущими методами при выполнении 15 задач манипуляции.

Архитектура

Отступающий контроль горизонта
Визуальное кондиционирование
Диффузионные трансформаторы временных рядов
МЖРР 2024

Официальные ссылки

diffusion-policy.cs.columbia.edu — Сайт проекта
github.com/columbia-ai-robotics/diffusion_policy — Код, дата, столбец

Цитирование

IJRR 2024. См. сайт проекта BibTeX.