机器人火烈鸟

作为有效机器人模仿者的视觉语言基础模型。基于 OpenFlamingo。

概述

RoboFlamingo 基于 OpenFlamingo 构建，将单步视觉语言理解与用于顺序机器人控制的显式策略头相结合。通过模仿学习进行微调。可在单个 GPU 服务器上进行训练。

架构与性能

OpenFlamingo 主干（MPT-3B、4B、9B 变体）
顺序决策的政策负责人
在 CALVIN 基准测试中表现出色
开环控制，低资源部署

官方链接

roboflamingo.github.io — 项目现场
github.com/RoboFlamingo/RoboFlamingo — 代码（带有）
拥抱脸：robovlms/RoboFlamingo — 模型

引文

请参阅项目站点以获取 BibTeX 和论文参考。