- RGB e profundidadeAinda a base para tarefas de manipulação guiadas pela percepção.
- Força e tátilImportante para transições ricas em contato e estabilidade de pegada.
- Linguagem e metadadosÚtil para recuperação, fatias de avaliação e fundamentação de instruções.
Conjuntos de dados de robôs multimodais
Conjuntos de dados multimodais conectam visão, ação, propriocepção e toque para que as equipes possam raciocinar sobre quais informações sua política realmente precisará.
Esta página ajuda as equipes a decidirem se precisam de mais modalidades, melhor alinhamento de tempo ou metadados mais claros antes de re-treinamento.