Маховик данных
Самый надежный способ улучшить политику обучения роботов — не менять модель, а улучшать данные. Маховик данных — это основной цикл итерации любого серьезного проекта обучения роботов:
Оценивать
Проведите 20 испытаний. Измерьте уровень успеха. Классифицируйте отказы по типам. Вы сделали это в модуле 5.
Определите основной режим отказа
Качество данных (непоследовательные демонстрации), сдвиг распределения (невидимые позиции) или емкость модели (достаточно точная траектория, но неправильная)? Ваш диагноз 5-го блока отвечает на этот вопрос.
Собирайте целевые данные
Запишите 20–30 демонстраций, посвященных конкретно режиму отказа. Если политика не работает с объектами в левой части рабочей области, запишите 20 демонстраций этой конкретной позиции. Не записывайте больше того, что уже работает.
Переподготовка и переоценка
Объедините новые данные с существующим набором данных, переобучите и снова запустите оценку из 20 испытаний. Ожидайте улучшения на 10–20 процентных пунктов за цикл, если диагноз верен.
Смешивание наборов данных
LeRobot может одновременно обучаться на нескольких наборах данных, что полезно для объединения данных целевого сбора с исходным набором данных или даже с общедоступными наборами данных сообщества для той же задачи и типа робота.
info.json любого набора данных, который вы планируете смешать.
Поделитесь своей моделью на HuggingFace Hub
Если вы поделитесь своей обученной моделью, она станет доступной для сообщества и позволит другим использовать вашу политику в качестве отправной точки. Модели, представленные в стандартном формате LeRobot, могут быть загружены любым пользователем с помощью pip install lerobot.
Поделитесь своим набором данных с сообществом
Ваш набор данных (который вы отправили в модуле 3) уже находится в HuggingFace Hub. Чтобы сделать его более доступным и полезным для других:
- Добавить карточка набора данных на HuggingFace — опишите задачу, робота, настройку записи и количество серий. Это самое эффективное, что вы можете сделать для обнаружения набора данных.
- Отметьте это с помощью
lerobot, тип вашего робота (например,so100) и категорию вашей задачи (например,pick-and-place). - Отправьте его в Библиотека наборов данных SVRC для курирования и включения в индекс сообщества.
Передача конфигураций оборудования обратно в LeRobot
Если вы добавили специальную конфигурацию оборудования для неподдерживаемого робота в модуле 1, рассмотрите возможность добавления ее обратно в репозиторий LeRobot. Откройте запрос на извлечение, чтобы huggingface/lerobot с вашим конфигурационным файлом в lerobot/configs/robot/. Специалисты по обслуживанию быстро проверяют вклад оборудования, и это приносит прямую пользу каждому будущему пользователю этого оборудования.
Что дальше: более эффективные политики
Теперь у вас есть полный рабочий процесс LeRobot. Вот куда идти дальше: