A Lacuna da Realidade

Políticas que alcançam 95% de sucesso na simulação muitas vezes caem para 30–50% no mundo real. Essa "lacuna da realidade" decorre de diferenças visuais (renderização vs imagens reais), diferenças físicas (imprecisões no modelo de contato) e padrões de ruído do sensor. Superar essa lacuna sistematicamente é uma das habilidades práticas mais importantes na aprendizagem de robôs.

Três Estratégias

Randomização de domínio: treinar em uma ampla distribuição de parâmetros para que o mundo real seja "apenas outra amostra." Identificação de sistema: medir e calibrar cuidadosamente os parâmetros de simulação para corresponder à realidade. Ajuste fino: treinar na simulação, depois coletar um pequeno conjunto de dados do mundo real (50–200 episódios) e ajustar. A maioria das implantações bem-sucedidas combina as três.

  • Randomização de domínio: melhor para políticas visuais
  • Identificação de sistema: melhor para tarefas ricas em contato
  • Ajuste fino no mundo real: quase sempre melhora o desempenho
  • Recomendado: combinar as três

Dicas Práticas

Comece com MuJoCo ou Isaac Sim (ambos têm bons modelos de contato). Randomize a posição da câmera, iluminação e texturas dos objetos de forma agressiva. Meça o atrito e a amortecimento reais das juntas. Valide a simulação para o real em uma tarefa simples antes de tentar tarefas complexas. O SVRC fornece modelos de simulação calibrados para o OpenArm.