← Модели

Политика распространения

Обучение зрительно-моторной политике посредством условного шумоподавления. Колумбийский университет.

Обзор

Политика распространения представляет поведение робота как процесс диффузии условного шумоподавления. Он обрабатывает мультимодальные распределения действий, многомерные пространства действий и демонстрирует высокую стабильность при обучении. Среднее улучшение на +46,9% по сравнению с предыдущими методами при выполнении 15 задач манипуляции.

Архитектура

  • Отступающий контроль горизонта
  • Визуальное кондиционирование
  • Диффузионные трансформаторы временных рядов
  • МЖРР 2024

Официальные ссылки

Цитирование

IJRR 2024. См. сайт проекта BibTeX.