← 模型

机器人火烈鸟

作为有效机器人模仿者的视觉语言基础模型。 基于 OpenFlamingo。

概述

RoboFlamingo 基于 OpenFlamingo 构建,将单步视觉语言理解与用于顺序机器人控制的显式策略头相结合。 通过模仿学习进行微调。 可在单个 GPU 服务器上进行训练。

架构与性能

  • OpenFlamingo 主干(MPT-3B、4B、9B 变体)
  • 顺序决策的政策负责人
  • 在 CALVIN 基准测试中表现出色
  • 开环控制,低资源部署

官方链接

引文

请参阅项目站点以获取 BibTeX 和论文参考。