机器人火烈鸟
作为有效机器人模仿者的视觉语言基础模型。 基于 OpenFlamingo。
概述
RoboFlamingo 基于 OpenFlamingo 构建,将单步视觉语言理解与用于顺序机器人控制的显式策略头相结合。 通过模仿学习进行微调。 可在单个 GPU 服务器上进行训练。
架构与性能
- OpenFlamingo 主干(MPT-3B、4B、9B 变体)
- 顺序决策的政策负责人
- 在 CALVIN 基准测试中表现出色
- 开环控制,低资源部署
官方链接
- roboflamingo.github.io — 项目现场
- github.com/RoboFlamingo/RoboFlamingo — 代码(带有)
- 拥抱脸:robovlms/RoboFlamingo — 模型
引文
请参阅项目站点以获取 BibTeX 和论文参考。