Octo
Política de Robot Generalista de Código Abierto — política de difusión basada en transformadores para manipulación.
Resumen
Octo es una política de difusión basada en transformadores entrenada en 800K trayectorias de robots de Open X-Embodiment. Soporta comandos de lenguaje o imágenes de objetivo, múltiples cámaras RGB y varios brazos robóticos. Octo-Small (27M) y Octo-Base (93M) pueden ser ajustados en horas en GPUs de consumo.
Arquitectura y Escala
- Octo-Small 27M parámetros, Octo-Base 93M parámetros
- 800K trayectorias de Open X-Embodiment
- Condicionamiento de lenguaje o imagen de objetivo
- Multi-cámara, multi-robot listo para usar
Enlaces Oficiales
- octo-models.github.io — Sitio del proyecto
- github.com/octo-models/octo — Código (MIT)
- Hugging Face: rail-berkeley/octo-models — Pesas
cita
Consulta el sitio del proyecto para referencias BibTeX y de artículos.