Octo
Política de Robô Generalista de Código Aberto — política de difusão baseada em transformadores para manipulação.
Visão Geral
Octo é uma política de difusão baseada em transformadores treinada em 800K trajetórias de robôs do Open X-Embodiment. Suporta comandos de linguagem ou imagens de objetivo, múltiplas câmeras RGB e vários braços de robô. Octo-Small (27M) e Octo-Base (93M) podem ser ajustados em horas em GPUs de consumo.
Arquitetura e Escala
- Octo-Small 27M parâmetros, Octo-Base 93M parâmetros
- 800K trajetórias do Open X-Embodiment
- Condicionamento de linguagem ou imagem de objetivo
- Multi-câmera, multi-robô pronto para uso
Links Oficiais
- octo-models.github.io — Site do projeto
- github.com/octo-models/octo - Código (MIT)
- Hugging Face: rail-berkeley/octo-models - Pesos
Citação
Veja o site do projeto para referências BibTeX e de artigos.