← Modelos

Octo

Política de Robô Generalista de Código Aberto — política de difusão baseada em transformadores para manipulação.

Visão Geral

Octo é uma política de difusão baseada em transformadores treinada em 800K trajetórias de robôs do Open X-Embodiment. Suporta comandos de linguagem ou imagens de objetivo, múltiplas câmeras RGB e vários braços de robô. Octo-Small (27M) e Octo-Base (93M) podem ser ajustados em horas em GPUs de consumo.

Arquitetura e Escala

  • Octo-Small 27M parâmetros, Octo-Base 93M parâmetros
  • 800K trajetórias do Open X-Embodiment
  • Condicionamento de linguagem ou imagem de objetivo
  • Multi-câmera, multi-robô pronto para uso

Links Oficiais

Citação

Veja o site do projeto para referências BibTeX e de artigos.