Definição
Políticas baseadas em transformador aplicam mecanismos de atenção ao controle do robô. Elas podem processar entradas heterogêneas — imagens, propriocepção, instruções de linguagem e histórico de ações — através de um modelo de sequência unificado. As principais arquiteturas incluem RT-1 (ações tokenizadas com visão EfficientNet), RT-2 (backbone VLM), ACT (transformador de agrupamento de ações para controle bimanual) e Octo (transformador escalável de cruzamento de incorporação). Transformadores lidam naturalmente com contextos de comprimento variável e condicionamento multitarefa. Seu principal desafio na robótica é a latência de inferência — controle em tempo real a 10–50 Hz requer designs de modelo eficientes ou agrupamento de ações para amortizar o cálculo.
Por que isso é importante para equipes de robôs
Compreender a política de transformadores é essencial para equipes que constroem sistemas robóticos do mundo real. Seja coletando dados de demonstração, treinando políticas em simulação ou implantando em produção, esse conceito afeta diretamente seu fluxo de trabalho e design do sistema.