Por qué la calidad de los datos importa más que la cantidad

Una idea errónea común en el aprendizaje de robots es que más demostraciones producen automáticamente una mejor política. Esto es falso. Las redes neuronales aprenden a imitar el distribución comportamiento en tu conjunto de datos. Si tus demostraciones son inconsistentes — diferentes caminos, diferentes velocidades, diferentes posiciones de objetos — la red aprende un promedio borroso que no corresponde a ninguna estrategia exitosa real.

50 demostraciones donde el brazo sigue el mismo camino limpio, agarra el objeto en la misma ubicación y regresa a la misma posición de inicio producirán una política que generaliza mejor que 500 demostraciones con alta variabilidad. La primera sesión de recolección es tu oportunidad para establecer esa consistencia. Tómate tu tiempo. Elimina y vuelve a grabar cualquier demostración que te haya parecido incorrecta.

Para una comprensión más profunda en el diseño de pipelines, lee el Visión general del Pipeline de Recolección de Datos en la Biblioteca de Robótica.

El Formato de Conjunto de Datos de LeRobot

Tus grabaciones se guardarán en formato LeRobot — el estándar utilizado por la biblioteca LeRobot de Hugging Face y compatible con los entrenadores de Política ACT y Difusión que usarás en la Unidad 5.

Lo que se graba

Posiciones de las juntas (6 DOF + pinza), velocidades de las juntas, pose del efector final, cuadros de cámara (RGB + profundidad opcional), marcas de tiempo y metadatos de la tarea.

Estructura de archivos

Una carpeta por episodio. Cada episodio contiene un data.parquet con arreglos de estado/acción y un video/ subcarpeta con flujos de cámara.

Tasa de muestreo

50Hz por defecto. Cada segundo de teleoperación produce 50 pasos de tiempo. Un pick-and-place de 10 segundos produce 500 pares (estado, acción).

Compatibilidad

El formato LeRobot se carga directamente en lerobot.common.datasets. También es convertible a RLDS para tuberías de TF-Agents. Navegar por conjuntos de datos de referencia →

Tu sesión de grabación

Lanza el script de grabación con el nombre de tu tarea y el número de episodios objetivo. El script maneja automáticamente la gestión de episodios, la nomenclatura de archivos y la señalización de calidad:

# Activate your environment first source ~/openarm-env/bin/activate # Launch recording — saves to ~/openarm-datasets/pick-and-place/ python -m openarm.collect \ # Press ENTER to start a new episode, BACKSPACE to discard the last one # The script prints a summary after every 10 episodes

Configura tu espacio de trabajo con el mismo objeto en la misma posición inicial para cada episodio. Usa marcas de cinta en la mesa para mantener la posición del objeto consistente. Tu brazo debe regresar a la misma pose de inicio exacta antes de que comience cada episodio; el script de grabación hace cumplir esto con una verificación de inicio.

Consejo práctico: Apunta a episodios de entre 8 y 15 segundos cada uno. Demasiado cortos (menos de 5s) y la política no tiene tiempo para planificar una trayectoria suave. Demasiado largos (más de 20s) y pequeñas variaciones se acumulan. Para un pick-and-place estándar, 10 segundos por episodio es el objetivo.

Lista de verificación de calidad de datos

Antes de avanzar a la Unidad 5, verifica que tu conjunto de datos pase todas estas cinco comprobaciones. Descarta y vuelve a grabar episodios que fallen en cualquier ítem.

  • 1 Sin agarres fallidos. Cada episodio termina con el objeto colocado exitosamente en la ubicación objetivo. Los episodios donde el brazo falló en el agarre o dejó caer el objeto deben ser eliminados; enseñan al modelo a fallar.
  • 2 Pose de inicio consistente. El brazo comienza desde la posición de inicio en cada episodio. Verifica en el visor de conjuntos de datos que los ángulos de las juntas en el tiempo 0 estén dentro de ±2° entre sí en los 50 episodios.
  • 3 Sin saltos o sacudidas repentinas. Visualiza de 3 a 5 episodios aleatorios con python -m lerobot.visualize_dataset --dataset ~/openarm-datasets/pick-and-place. Las secuencias de acción deben ser curvas continuas suaves, no picos.
  • 4 Los marcos de la cámara son claros y están enfocados. Verifica que la cámara de tu espacio de trabajo no esté obstruida, no esté iluminada directamente y que el objeto sea claramente visible durante cada episodio. Un video borroso o oscuro degrada el rendimiento de la política.
  • 5 50 episodios completos guardados. Ejecutar python -m lerobot.inspect ~/openarm-datasets/pick-and-place y confirma que tienes exactamente 50 episodios sin archivos corruptos. El script marcará cualquier episodio con marcos faltantes o secuencias de acción truncadas.

Navegar por conjuntos de datos de referencia para comparación.

La biblioteca de conjuntos de datos SVRC contiene grabaciones de ejemplo de recogida y colocación que puedes usar como referencia de calidad. Si tus datos se ven significativamente diferentes, investiga antes de entrenar. Abrir conjuntos de datos SVRC →

Unidad 4 Completa Cuando...

Tienes 50 episodios limpios guardados en formato LeRobot en ~/openarm-datasets/pick-and-place. Todos los cinco elementos de la lista de verificación de calidad pasan. Ejecutando lerobot.inspect muestra 50 episodios, sin errores. Estás listo para entregar este conjunto de datos a la tubería de entrenamiento en la Unidad 5.