El Ciclo de Datos.
La forma más confiable de mejorar una política de aprendizaje de robots no es cambiar el modelo, sino mejorar los datos. El ciclo de datos es el bucle de iteración central para cualquier proyecto serio de aprendizaje de robots.
Evaluar
Realiza 20 ensayos. Mide la tasa de éxito. Categoriza las fallas por tipo. Hiciste esto en la Unidad 5.
Identifica el modo de falla principal.
¿Es la calidad de los datos (demostraciones inconsistentes), el cambio de distribución (posiciones no vistas) o la capacidad del modelo (trayectoria lo suficientemente precisa pero incorrecta)? Tu diagnóstico de la Unidad 5 responde a esto.
Recopilar datos específicos
Grabar de 20 a 30 demostraciones que cubran específicamente el régimen de fallos. Si la política falla en objetos en el lado izquierdo del espacio de trabajo, graba 20 demostraciones de esa posición específica. No grabes más de lo que ya está funcionando.
Volver a entrenar y reevaluar
Fusionar los nuevos datos con tu conjunto de datos existente, volver a entrenar y ejecutar nuevamente la evaluación de 20 ensayos. Espera una mejora de 10 a 20 puntos porcentuales por ciclo cuando el diagnóstico fue correcto.
Mezclando conjuntos de datos
LeRobot puede entrenar en múltiples conjuntos de datos simultáneamente, lo cual es útil para combinar tus datos de colección específicos con tu conjunto de datos original, o incluso con conjuntos de datos comunitarios públicos para la misma tarea y tipo de robot.
info.json de cualquier conjunto de datos que planees mezclar.
Comparte tu modelo en HuggingFace Hub
Compartir tu modelo entrenado lo hace disponible para la comunidad y permite que otros usen tu política como punto de partida. Los modelos compartidos en el formato estándar de LeRobot pueden ser cargados directamente por cualquier persona con pip install lerobot.
Comparte tu conjunto de datos con la comunidad
Tu conjunto de datos (que subiste en la Unidad 3) ya está en HuggingFace Hub. Para hacerlo más descubrible y útil para otros:
- Agrega un tarjeta de conjunto de datos en HuggingFace — describe la tarea, el robot, la configuración de grabación y el número de episodios. Esta es la cosa más impactante que puedes hacer para la descubribilidad del conjunto de datos.
- Etiquétalo con
lerobot, tu tipo de robot (por ejemplo,so100), y tu categoría de tarea (por ejemplo,pick-and-place). - Envíalo a la Biblioteca de conjuntos de datos SVRC para curación e inclusión en el índice de la comunidad.
Contribuyendo configuraciones de hardware de vuelta a LeRobot
Si agregaste una configuración de hardware personalizada para un robot no soportado en la Unidad 1, considera contribuirla de vuelta al repositorio de LeRobot. Abre una solicitud de extracción a huggingface/lerobot con tu archivo de configuración en lerobot/configs/robot/. Los mantenedores revisan las contribuciones de hardware rápidamente y esto beneficia directamente a cada futuro usuario de ese hardware.
¿Qué sigue?: Políticas más capaces
Ahora tienes el flujo de trabajo completo de LeRobot. Aquí está a dónde ir desde aquí: