定义

在机器人技术中,基础模型是指在广泛的数据集(互联网图像、文本或跨实施例机器人数据)上预训练的大型神经网络,它提供可转移到特定任务的一般表示。 RT-2、OpenVLA 和 π₀ 等视觉-语言-动作模型 (VLA) 就是例子。 这些模型接受语言指令和视觉观察来产生机器人动作。 关键优势是减少了新任务的数据需求,因为预训练的表示已经捕获了有用的视觉和语义概念。

为什么它对机器人团队很重要

了解基础模型对于构建现实世界机器人系统的团队至关重要。 无论您是收集演示数据、在模拟中训练策略,还是在生产中部署,此概念都会直接影响您的工作流程和系统设计。