- Política de DifusãoForte para dados de demonstração de alta qualidade e modelagem de trajetória.
- ACT / LeRobotÚtil para ciclos práticos de aprendizado por imitação.
- VLAs menoresÚtil quando os dados de teleoperação fazem parte de uma pilha condicionada por linguagem mais ampla.
Modelos para bootstrapping de teleoperação
Equipes que priorizam teleoperação geralmente precisam de modelos que aprendem rapidamente com demonstrações, preservam o viés do operador de forma produtiva e expõem claramente os pontos de falha.
Se você precisa de vitórias rápidas de um conjunto de dados de teleoperação focado, políticas de imitação específicas de tarefa geralmente superam grandes modelos gerais em tempo para valor.