Unidade 0: Orientação Bimanual — Caminho de Aprendizado do DK1

Se você completou o caminho OpenArm: A maioria dos padrões do SDK, conceitos do ROS 2 e fluxos de trabalho do LeRobot são os mesmos. O que é novo é a arquitetura líder/seguidor, a configuração de braços duplos sincronizados e os maiores requisitos de dados para tarefas bimanuals. Esta unidade cobre exatamente essas diferenças.

Por que Dois Braços?

Um único braço robótico é poderoso para tarefas onde um efetor final é suficiente: pegar e colocar, classificar, inspecionar. Mas uma grande classe de tarefas de manipulação do mundo real requer fundamentalmente duas mãos — da mesma forma que os humanos usam ambas as mãos como uma questão de curso. Segurar um recipiente enquanto despeja. Montar peças que requerem uma mão para estabilizar e uma para inserir. Dobrando tecido, descascando embalagens, passando um objeto de uma mão para a outra durante a tarefa.

Essas tarefas não são apenas "mais difíceis" com um braço — elas são arquitetonicamente incompatíveis com uma configuração de braço único. A arquitetura bimanual do DK1 dá acesso a toda essa classe de tarefas. E como ambos os braços operam em um espaço de trabalho compartilhado com estados de junta sincronizados, a configuração de aprendizado por imitação — teleoperação líder/seguidor alimentando uma única política — é mais limpa do que você pode esperar.

O Conceito de Líder/Seguido

O DK1 usa um arquitetura líder/seguidor para teleoperação. O conceito é simples:

Braço Líder

O que você move

Um braço controlador leve e com capacidade de retroalimentação que você manipula fisicamente com suas mãos. Ele não tem capacidade de carga — sua única função é sentir e transmitir seu movimento pretendido em alta frequência.

Braços Seguidores (×2)

O que executa a tarefa

Os dois braços DK1 de força total que espelham os ângulos das juntas do líder em tempo real. Eles interagem com o espaço de trabalho real e objetos. Estes são os braços que executam a política treinada durante a implantação.

Quando você teleopera, você move fisicamente o braço líder. Os braços seguidores replicam esse movimento em milissegundos. Quando você grava dados, os estados das articulações do braço seguidor — não do líder — são o que é salvo. Quando você treina uma política, você está treinando os braços seguidores para reproduzir os padrões de movimento que seu líder capturou. O braço líder é completamente desconsiderado no momento da inferência.

Esta arquitetura é mais natural do que a teleoperação por teclado ou controle VR porque o mapeamento de movimento é direto: mover o líder 30° mapeia para 30° no seguidor. A propriocepção do seu corpo se transfere diretamente para o robô.

Lista de verificação de hardware

Verifique cada item abaixo antes de começar a Unidade 1.

Braço seguidor DK1 ×2 — ambos os braços do kit. Verifique se ambos chegaram sem danos e se todas as articulações se movem livremente quando sem energia.
Braço do controlador líder DK1 — o controlador de teleoperação mais leve e com retroalimentação. Deve ser fácil de mover à mão.
Fontes de alimentação ×2 — um por braço seguidor. Incluído no kit. Verifique se a especificação de voltagem corresponde à sua tomada (veja o rótulo na fonte).
Cabos USB-C ×3 — um por braço (ambos os seguidores + líder) para a conexão inicial. Cabos mais curtos (0,5–1m) são mais fáceis de gerenciar em um espaço de trabalho bimanual.
Câmeras ×2 — uma câmera de espaço de trabalho de grande angular (de cima para baixo ou voltada para frente) e uma câmera de pulso no braço seguidor principal. Uma terceira câmera no braço secundário é opcional, mas recomendada para tarefas ricas em contato.
Hardware de montagem — o DK1 requer montagem fixa para ambos os braços seguidores. O kit inclui placas para fixação. Uma mesa rígida ou bancada de laboratório é necessária — uma mesa dobrável introduzirá vibrações que degradam seus dados.
Espaço de trabalho bimanual — pelo menos 80cm × 60cm de superfície plana e livre entre os dois braços. Marque os limites de alcance do braço com fita durante a Unidade 1 para definir o envelope de operação seguro.

Sem hardware físico? Você pode completar a maior parte deste caminho na simulação bimanual MuJoCo. Veja o Guia de configuração da simulação DK1 antes da Unidade 1.

Lista de verificação de software

Ubuntu 22.04 ou 24.04 — mesmo requisito que o OpenArm. Uma VM funciona para simulação; hardware real requer Linux nativo para desempenho em tempo real do barramento CAN.
Python 3.10 ou superior — executar python3 --version para verificar.
ROS 2 Humilde ou Jazzy — se você completou o caminho do OpenArm, isso já está instalado. Execute ros2 --version para verificar.
SDK DK1 (separado do SDK OpenArm) — instalação coberta na Unidade 2. Não instale agora — a configuração de emparelhamento deve ocorrer após ambos os braços estarem fisicamente montados.
LeRobot — se você o tiver instalado a partir do caminho do OpenArm, funcionará aqui. O formato do conjunto de dados bimanual usa a mesma estrutura com dois arrays de estado de junta. Versão ≥0.3.0 necessária para suporte bimanual.
~25 GB de espaço livre em disco — conjuntos de dados bimanual são maiores do que conjuntos de dados de braço único (duas streams de estado de junta, dois feeds de câmera). Pontos de verificação de treinamento adicionam mais 5–10 GB.
GPU com 10GB+ de VRAM — fortemente recomendado. O treinamento bimanual ACT na CPU é viável, mas levará de 8 a 12 horas para uma boa execução de treinamento. Uma RTX 3080 ou melhor reduz isso para menos de 2 horas.

Estimativas de Tempo

A configuração bimanual leva mais tempo do que a configuração de braço único — considere o tempo para montagem, alinhamento e verificação de sincronização para cada unidade.

Unidade	O que Você Faz	Tempo
0	Esta orientação	30 min
1	Monte e conecte dois braços, câmeras	~3 h
2	SDK, emparelhamento líder/seguidor, teste de sincronização	~2 h
3	Primeira sessão de teleoperação bimanual	~2 h
4	Grave 100 demonstrações sincronizadas	~3 h
5	Treine a política bimanual do ACT	~4 h
6	Implantar, avaliar, melhorar	~2 h
Total		~16 h 30 min

Planeje 4–5 sessões. As Unidades 1 e 2 se encaixam naturalmente (configuração de hardware + configuração de software em uma sessão). As Unidades 3 e 4 são melhor feitas juntas uma vez que você esteja fluente em teleoperação bimanual. O treinamento da Unidade 5 pode ser realizado durante a noite.

Como Obter Ajuda

Verifique o verificação de conclusão na parte inferior de qualquer unidade em que você esteja — isso define exatamente como é "concluído".
Postar não tópico do fórum DK1 — inclua sua versão do Ubuntu, versão do SDK, mensagem de erro exata e em qual unidade você está. Problemas específicos de bimanual frequentemente têm códigos de erro específicos de braço; inclua ambos.
Verifique o seção de solução de problemas na Unidade 2 — cobre os erros de sincronização líder/seguidor mais comuns.
Junte-se ao SVRC Discord em #dk1-path — resposta mais rápida durante o horário diurno do PST.

Alternativa de Simulação

O caminho DK1 suporta uma simulação bimanual MuJoCo que replica a arquitetura líder/seguidor, estados de juntas sincronizados e feeds de câmera. Você pode completar as Unidades 0 a 5 inteiramente na simulação. A Unidade 6 (implantação de hardware real) requer braços físicos. O guia de configuração da simulação está em hardware/dk1/simulation.

Orientação Completa Quando...

Você verificou cada item nas listas de verificação de hardware e software, entende o conceito de líder/seguidor e pode explicá-lo em uma frase, sabe onde pedir ajuda e reservou sua primeira sessão de 3 horas para a configuração de hardware da Unidade 1.

Antes de Começar: Orientação Bimanual

Por que Dois Braços?

O Conceito de Líder/Seguido

O que você move

O que executa a tarefa

Lista de verificação de hardware

Lista de verificação de software

Estimativas de Tempo

Como Obter Ajuda

Alternativa de Simulação

Orientação Completa Quando...