Definição

A Política de Difusão aplica modelos probabilísticos de difusão com desnoising (DDPMs) à geração de ações. Em vez de prever uma única ação, o modelo desnoisa iterativamente uma amostra aleatória em uma trajetória de ação. Isso permite capturar distribuições multimodais sobre comportamentos possíveis — crítico para manipulação rica em contato, onde existem múltiplas estratégias válidas. A Política de Difusão mostrou resultados fortes em tarefas bimanual, uso de ferramentas e dobradura de tecidos. Normalmente, opera em blocos de ação (sequências de 8 a 32 ações futuras) em vez de previsões de um único passo.

Por que isso é importante para equipes de robôs

Compreender a política de difusão é essencial para equipes que constroem sistemas robóticos do mundo real. Seja coletando dados de demonstração, treinando políticas em simulação ou implantando em produção, esse conceito afeta diretamente seu fluxo de trabalho e design de sistema.