Guia de Configuração do Mobile ALOHA: Hardware, Software e Primeira Demonstração
O Mobile ALOHA é uma das plataformas de manipulação bimanual mais influentes que surgiram da pesquisa acadêmica. Fazer com que funcione de ponta a ponta — hardware montado, braços calibrados, pilha de software ativa e primeira demonstração gravada — requer atenção cuidadosa a cada camada do sistema.
Visão Geral da Montagem do Hardware
Um sistema Mobile ALOHA consiste em uma base móvel com rodas (tipicamente uma AgileX Tracer ou plataforma de tração diferencial equivalente) com dois braços ViperX 300 ou similares de 6-DOF montados em um chassi elevado. A configuração bimanual requer pares correspondentes de braços líder e seguidor: os braços líderes são mais leves, acionáveis por trás e mantidos pelo operador humano durante a teleoperação; os braços seguidores são os braços do robô que espelham os movimentos do líder em tempo real.
A montagem começa com a fixação dos braços seguidores ao chassi na altura e deslocamento lateral corretos para corresponder à ergonomia do braço líder. Um desajuste entre a geometria do líder e do seguidor é uma fonte comum de problemas de qualidade de controle. A pilha de câmeras — tipicamente uma câmera montada no pulso em cada braço seguidor, além de uma ou duas câmeras overhead — deve ser instalada e fixada antes que qualquer calibração de software comece. A gestão de cabos é mais importante do que parece: cabos soltos interrompem episódios e geram dados ruins.
Calibração Líder-Seguidor
A calibração é a etapa que a maioria das equipes apressa e que a maioria das equipes se arrepende. Os braços líder e seguidor devem estar em posições de zero de junta correspondentes antes de gravar um único episódio. A maioria das configurações baseadas em ViperX é enviada com dispositivos de calibração física — use-os. Após o zero mecânico, a calibração de software captura o desvio de junta entre líder e seguidor na pose zero e o armazena como uma correção de viés aplicada em tempo real durante a teleoperação.
Teste a qualidade da calibração comandando os braços líderes lentamente através de seu espaço de trabalho e observando os braços seguidores acompanharem. Qualquer atraso persistente no espaço de juntas, desvio em ângulos de juntas específicos ou resposta assimétrica entre esquerda e direita indica um erro de calibração que degradará seu conjunto de dados. Recalibre antes de iniciar qualquer campanha de coleta de dados e re-verifique a calibração após enviar o sistema ou fazer ajustes mecânicos.
Pilha de Software: ACT e LeRobot
O artigo original do Mobile ALOHA usou a política ACT (Action Chunking with Transformers) treinada com dados de demonstração. A pilha de software é composta por três camadas: uma camada de controle de baixo nível rodando no computador embutido do robô, uma camada de gravação de teleoperação que captura estados das juntas e quadros da câmera de forma síncrona, e uma camada de treinamento onde o ACT ou outra política é treinada no conjunto de dados coletado.
O LeRobot da Hugging Face se tornou a estrutura padrão de código aberto para esse fluxo de trabalho. Ele fornece um formato de dados unificado, scripts de gravação para hardware no estilo ALOHA e pipelines de treinamento para ACT, Diffusion Policy e TDMPC. plataforma de dados O SVRC exporta conjuntos de dados em formato compatível com LeRobot, facilitando o treinamento com dados coletados pelo SVRC ou o upload de suas próprias demonstrações para armazenamento e versionamento.
Gravando Sua Primeira Sessão de Coleta de Dados
Antes de gravar, defina a tarefa com precisão. "Pegar a xícara" é muito vago — especifique a localização inicial da xícara, a orientação e o local de colocação. A consistência na configuração da tarefa é o que torna os conjuntos de dados de demonstração aprendíveis. Prepare de 3 a 5 procedimentos de reinicialização para retornar rapidamente o espaço de trabalho ao estado inicial entre os episódios.
Para uma primeira sessão, busque 50 demonstrações bem-sucedidas de uma única tarefa claramente definida. Grave a 30 Hz ou mais. Anote cada episódio com uma bandeira de sucesso imediatamente após a gravação — não deixe a anotação para depois. O SVRC recomenda gravar em pelo menos duas condições de iluminação diferentes e com pequenas variações na colocação dos objetos para construir diversidade desde o início. Plataforma de serviços de dados do SVRC fornece ferramentas de navegador de episódios e anotação para agilizar esse fluxo de trabalho.
Problemas Comuns e Como Corrigi-los
Os problemas mais frequentes com novas configurações do Mobile ALOHA se enquadram em quatro categorias. Primeiro, atraso entre líder e seguidor: geralmente causado por latência de rede no loop de controle — assegure-se de que o líder e o seguidor estejam na mesma máquina local ou conectados via um link Ethernet dedicado, não WiFi. Segundo, desvio de sincronização da câmera: se as câmeras de pulso e de cima não estiverem sincronizadas por hardware, use alinhamento baseado em timestamp durante o carregamento de dados em vez de alinhamento por índice de quadro. Terceiro, colisão do braço durante tarefas bimanual: adicione limites de junta suaves e malhas de colisão no URDF antes do treinamento intensivo. Quarto, movimento da base interferindo nas demonstrações do braço: ao coletar dados apenas de manipulação, ative o bloqueio da base para evitar desvios.
Próximos Passos Após Sua Primeira Demonstração
Uma vez que você tenha um conjunto de dados limpo de 50 episódios, use o pipeline de treinamento do LeRobot para treinar uma política ACT. Espere taxas de sucesso na primeira tentativa de 40 a 60% em uma tarefa bem definida com dados limpos — isso é normal e melhora rapidamente com mais demonstrações e diversidade de dados. À medida que você escala, o SVRC pode serviços de coleta de dados aumentar seu conjunto de dados com episódios coletados profissionalmente usando hardware padronizado. Para aquisição de hardware ou para alugar um sistema bimanual, visite nosso catálogo de hardware ou entre em contato com a equipe do SVRC.