РобоФламинго
Модели Vision-Language Foundation как эффективные имитаторы роботов. На основе OpenFlamingo.
Обзор
RoboFlamingo основывается на OpenFlamingo и объединяет одноэтапное понимание языка видения с четкой политикой для последовательного управления роботом. Точная настройка посредством имитационного обучения. Обучается на одном сервере с графическим процессором.
Архитектура и производительность
- Магистраль OpenFlamingo (варианты MPT-3B, 4B, 9B)
- Руководитель политики последовательного принятия решений
- Сильный результат по эталону CALVIN
- Разомкнутое управление, развертывание с низким уровнем ресурсов
Официальные ссылки
- roboflamingo.github.io — Сайт проекта
- github.com/RoboFlamingo/RoboFlamingo — Код (С)
- Обнимающее лицо: robovlms/RoboFlamingo — Модели
Цитирование
пгт. сайт проекта BibTeX и ссылки на статьи.