Guía de Configuración de Mobile ALOHA: Hardware, Software y Primera Demostración
Mobile ALOHA es una de las plataformas de manipulación bimanual más influyentes que han surgido de la investigación académica. Hacer que funcione de extremo a extremo — hardware ensamblado, brazos calibrados, pila de software activa y primera demostración grabada — requiere atención cuidadosa a cada capa del sistema.
Resumen del Ensamblaje de Hardware
Un sistema Mobile ALOHA consiste en una base móvil con ruedas (típicamente una AgileX Tracer o plataforma de tracción diferencial equivalente) con dos brazos ViperX 300 o similares de 6 grados de libertad montados en un chasis elevado. La configuración bimanual requiere pares coincidentes de brazos líder y seguidor: los brazos líder son más ligeros, se pueden accionar hacia atrás y son sostenidos por el operador humano durante la teleoperación; los brazos seguidores son los brazos del robot que reflejan los movimientos del líder en tiempo real.
El ensamblaje comienza montando los brazos seguidores en el chasis a la altura correcta y con el desplazamiento lateral adecuado para coincidir con la ergonomía del brazo líder. Un desajuste entre la geometría del líder y el seguidor es una fuente común de problemas de calidad de control. La pila de cámaras — típicamente una cámara montada en la muñeca en cada brazo seguidor más una o dos cámaras aéreas — debe ser instalada y asegurada antes de que comience cualquier calibración de software. La gestión de cables importa más de lo que parece: los cables sueltos interrumpen episodios y generan datos erróneos.
Calibración de Líder-Seguidor
La calibración es el paso que la mayoría de los equipos apresuran y que la mayoría de los equipos lamentan. Los brazos líder y seguidor deben estar en posiciones de cero de articulación coincidentes antes de grabar un solo episodio. La mayoría de las configuraciones basadas en ViperX se envían con accesorios de calibración física — úselos. Después de la puesta a cero mecánica, la calibración de software captura el desplazamiento de articulación entre el líder y el seguidor en la pose cero y lo almacena como una corrección de sesgo aplicada en tiempo real durante la teleoperación.
Pruebe la calidad de la calibración comandando los brazos líderes lentamente a través de su espacio de trabajo y observando cómo siguen los brazos seguidores. Cualquier retraso persistente en el espacio de articulación, deriva en ángulos de articulación específicos o respuesta asimétrica entre izquierda y derecha indica un error de calibración que degradará su conjunto de datos. Recalibre antes de comenzar cualquier campaña de recolección de datos y vuelva a verificar la calibración después de enviar el sistema o hacer ajustes mecánicos.
Pilas de software: ACT y LeRobot
El documento original de Mobile ALOHA utilizó la política ACT (Action Chunking with Transformers) entrenada con datos de demostración. La pila de software consta de tres capas: una capa de control de bajo nivel que se ejecuta en la computadora embebida del robot, una capa de grabación de teleoperación que captura estados de las articulaciones y cuadros de cámara de manera sincrónica, y una capa de entrenamiento donde se entrena ACT u otra política con el conjunto de datos recopilado.
LeRobot de Hugging Face se ha convertido en el marco de código abierto estándar para este flujo de trabajo. Proporciona un formato de datos unificado, scripts de grabación para hardware estilo ALOHA y pipelines de entrenamiento para ACT, Diffusion Policy y TDMPC. plataforma de datos SVRC exporta conjuntos de datos en formato compatible con LeRobot, lo que facilita el entrenamiento con datos recopilados por SVRC o la carga de tus propias demostraciones para almacenamiento y versionado.
Grabando tu primera sesión de recolección de datos
Antes de grabar, define la tarea con precisión. "Recoger la taza" es demasiado vago: especifica la ubicación inicial de la taza, la orientación y el lugar de destino. La consistencia en la configuración de la tarea es lo que hace que los conjuntos de datos de demostración sean aprendibles. Prepara de 3 a 5 procedimientos de reinicio para devolver rápidamente el espacio de trabajo al estado inicial entre episodios.
Para una primera sesión, apunta a 50 demostraciones exitosas de una tarea única y bien definida. Graba a 30 Hz o más. Anota cada episodio con una bandera de éxito inmediatamente después de grabar; no dejes la anotación para más tarde. SVRC recomienda grabar en al menos dos condiciones de iluminación diferentes y con variaciones menores en la colocación de objetos para incorporar diversidad desde el principio. Plataforma de servicios de datos de SVRC Proporciona herramientas de navegador de episodios y anotación para agilizar este flujo de trabajo.
Problemas comunes y cómo solucionarlos
Los problemas más frecuentes con las nuevas configuraciones de Mobile ALOHA se dividen en cuatro categorías. Primero, retraso entre líder y seguidor: generalmente causado por la latencia de la red en el bucle de control; asegúrate de que el líder y el seguidor estén en la misma máquina local o conectados a través de un enlace Ethernet dedicado, no WiFi. Segundo, deriva de sincronización de cámaras: si las cámaras de muñeca y de overhead no están sincronizadas por hardware, utiliza alineación basada en marcas de tiempo durante la carga de datos en lugar de alineación por índice de cuadro. Tercero, colisión del brazo durante tareas bimanuales: añade límites de articulación suaves y mallas de colisión en el URDF antes del entrenamiento intensivo. Cuarto, movimiento de la base interfiriendo con las demostraciones del brazo: al recopilar datos solo de manipulación, activa el bloqueo de la base para evitar la deriva.
Próximos pasos después de tu primera demostración
Una vez que tengas un conjunto de datos limpio de 50 episodios, utiliza el pipeline de entrenamiento de LeRobot para entrenar una política ACT. Espera tasas de éxito en el primer intento del 40 al 60% en una tarea bien definida con datos limpios; esto es normal y mejora rápidamente con más demostraciones y diversidad de datos. A medida que escales, SVRC puede aumentar tu conjunto de datos con episodios recopilados profesionalmente utilizando hardware estandarizado. servicios de recolección de datos Para la adquisición de hardware o para arrendar un sistema bimanual, visita nuestro catálogo de hardware o contacta al equipo de SVRC.