为什么这个单位存在: 人们放弃机器人教程的最常见原因并不是困难,而是因为缺少依赖项、他们的 Python 版本错误或者他们不知道该问谁而在课程中陷入困境。 这个单位的存在是为了让这种事永远不会发生在你身上。
什么是乐机器人?
LeRobot是HuggingFace的开源机器人学习库。 它为您提供统一的数据集格式、预训练的 VLA 模型(ACT、Diffusion Policy、Pi0Fast、SmolVLA)以及在 10 多个机器人平台上相同工作的硬件抽象层。 它是 2025-2026 年开源模仿学习的事实上的标准。
这条路径以框架为中心,而不是特定于硬件。 您在此处学习的工作流程适用于任何支持的机器人,并在您添加新硬件时直接转移到新硬件。
你将建造什么
到此路径结束时,您将获得 经过训练的 ACT 取放政策 在您的机器人上运行(或在模拟中)。 您将录制 50-100 个演示、训练策略、评估策略,并在 HuggingFace Hub 上共享数据集和模型。 相同的工作流程适用于任何任务 - 一旦完成一次,您就可以将其应用于任何任务。
支持的硬件
此路径适用于以下任何路径。 你只需要一个。
没有实体机器人吗? 您可以在 MuJoCo 模拟中完成整个路径 - 第 1 单元明确涵盖了模拟设置。
软件清单
在开始第 1 单元之前验证每一项。
- Python 3.10 或更高版本 - 跑步
python3 --version检查。 安装通过sudo apt install python3.10或者 pyenv. - 点 - 跑步
pip3 --version。 安装通过sudo apt install python3-pip. - git - 跑步
git --version。 安装通过sudo apt install git. - 免费的 HuggingFace 帐户 — 在第 3 单元中需要推送您的数据集,在第 6 单元中需要共享您的模型。 在 Huggingface.co 创建一个 — 需要 2 分钟。
- ~10 GB 可用磁盘空间 — 适用于 LeRobot、MuJoCo 和您的数据集。 数据集增长迅速; 20GB 很舒服。
- CUDA GPU(可选) — CPU 上的 ACT 训练适用于小型数据集,但需要 8-12 小时,而不是 1-2 小时。 建议第 4 单元使用具有 8GB+ VRAM 的 NVIDIA GPU。 第 4 单元介绍了云 GPU 选项。
预计时间
这些是实际的估计,包括设置和故障排除时间。 第 4 单元的训练可以在无人值守的情况下进行——在睡觉前开始。
| 单元 | 你做什么 | 时间 |
|---|---|---|
| 0 | 这个方向 | 20分钟 |
| 1 | 安装并验证乐机器人 | 〜1小时 |
| 2 | 探索数据集格式 | 〜1.5小时 |
| 3 | 记录 50 多次演示 | 〜2小时 |
| 4 | 培训 ACT 政策 | 〜3小时 |
| 5 | 评估和诊断 | 〜1小时 |
| 6 | 改进和分享 | 〜1.5小时 |
| 全部的 | 约 10 小时 20 分钟 | |
如何获得帮助
如果您遇到困难,请按以下顺序使用这些资源:
- 检查 完成检查 在您所在单元的底部 - 它通常可以准确识别缺少的内容。
- 搜索 乐机器人GitHub问题 — 大多数环境和硬件配置错误都记录在那里。
- 发表在 SVRC论坛 — 包括您的 Python 版本、操作系统、机器人类型、确切的错误消息以及您所在的单元。
- 加入 HuggingFace 不和谐#lerobot — 乐机器人维护人员在太平洋标准时间工作时间内非常活跃并快速响应。
受阻时请勿向前跳跃。 该路径在设计上是连续的 - 如果您陷入第 3 单元,通常意味着第 1 单元或第 2 单元尚未完全完成。
定向完成时...
您已经检查了软件清单中的每一项,您有一个 HuggingFace 帐户,您知道在遇到困难时进入论坛的路径,并且您已经为第 1 单元预留了第一个 1 小时的课程。