扩散政策

定义

扩散策略将去噪扩散概率模型 (DDPM) 应用于动作生成。该模型不是预测单个动作，而是迭代地将随机样本去噪为动作轨迹。这使得能够捕获可能行为的多模态分布——对于存在多种有效策略的接触丰富的操作至关重要。扩散政策在双手任务、工具使用和布料折叠方面显示出强大的效果。它通常对动作块（8-32 个未来动作的序列）而不是单步预测进行操作。

为什么它对机器人团队很重要

了解扩散策略对于构建现实世界机器人系统的团队至关重要。无论您是收集演示数据、在模拟中训练策略，还是在生产中部署，此概念都会直接影响您的工作流程和系统设计。

定义

为什么它对机器人团队很重要

相关页面

政策学习

模仿学习

机器人学院

研究文章