A Lacuna da Realidade
Políticas que alcançam 95% de sucesso na simulação muitas vezes caem para 30–50% no mundo real. Essa "lacuna da realidade" decorre de diferenças visuais (renderização vs imagens reais), diferenças físicas (imprecisões no modelo de contato) e padrões de ruído do sensor. Superar essa lacuna sistematicamente é uma das habilidades práticas mais importantes na aprendizagem de robôs.
Três Estratégias
Randomização de domínio: treinar em uma ampla distribuição de parâmetros para que o mundo real seja "apenas outra amostra." Identificação de sistema: medir e calibrar cuidadosamente os parâmetros de simulação para corresponder à realidade. Ajuste fino: treinar na simulação, depois coletar um pequeno conjunto de dados do mundo real (50–200 episódios) e ajustar. A maioria das implantações bem-sucedidas combina as três.
- Randomização de domínio: melhor para políticas visuais
- Identificação de sistema: melhor para tarefas ricas em contato
- Ajuste fino no mundo real: quase sempre melhora o desempenho
- Recomendado: combinar as três
Dicas Práticas
Comece com MuJoCo ou Isaac Sim (ambos têm bons modelos de contato). Randomize a posição da câmera, iluminação e texturas dos objetos de forma agressiva. Meça o atrito e a amortecimento reais das juntas. Valide a simulação para o real em uma tarefa simples antes de tentar tarefas complexas. O SVRC fornece modelos de simulação calibrados para o OpenArm.