РобоФламинго

Модели Vision-Language Foundation как эффективные имитаторы роботов. На основе OpenFlamingo.

Обзор

RoboFlamingo основывается на OpenFlamingo и объединяет одноэтапное понимание языка видения с четкой политикой для последовательного управления роботом. Точная настройка посредством имитационного обучения. Обучается на одном сервере с графическим процессором.

Архитектура и производительность

Магистраль OpenFlamingo (варианты MPT-3B, 4B, 9B)
Руководитель политики последовательного принятия решений
Сильный результат по эталону CALVIN
Разомкнутое управление, развертывание с низким уровнем ресурсов

Официальные ссылки

roboflamingo.github.io — Сайт проекта
github.com/RoboFlamingo/RoboFlamingo — Код (С)
Обнимающее лицо: robovlms/RoboFlamingo — Модели

Цитирование

пгт. сайт проекта BibTeX и ссылки на статьи.