← Glossário

Aprendizado de Políticas

Mapeamento de observações para ações — políticas visuomotoras para controle de robô.

O Que É Aprendizado de Políticas?

Uma política é uma função que mapeia observações (imagens, estado) para ações (comandos de junta, garra). O aprendizado de políticas treina esse mapeamento a partir de dados (imitação) ou recompensa (RL). Políticas visuomotoras usam visão como a entrada principal.

Arquiteturas Chave

  • ACT (Agrupamento de Ações com Transformadores) — Previsão de blocos de ação; execução suave.
  • Política de Difusão — Difusão de desnoising para distribuições de ações multimodais.
  • Clonagem de Comportamento — Aprendizado supervisionado simples a partir de demonstrações.
  • VLA — Modelos de visão-linguagem-ação (OpenVLA, RT-2) com condicionamento de linguagem.

Recursos Relacionados