Conecte Seu Robô ou Abra a Simulação
Se você estiver usando um robô real, conecte-o agora e confirme que ele é reconhecido pelo seu sistema antes de executar o comando de gravação. Se você estiver trabalhando em simulação, o comando de gravação pode controlar um robô virtual no gym_pusht ou gym_aloha ambientes usando um teclado ou política scriptada como fonte de teleoperação.
Você deve ver os estados das juntas sendo transmitidos na saída do terminal e (para robôs reais) o braço respondendo à entrada. Se não, resolva o problema de conexão antes de prosseguir — gravar com um robô desconectado produz silenciosamente dados corrompidos.
O Comando de Gravação
O comando principal de gravação. Adapte as flags para sua configuração:
--robot-path pela sua configuração de simulação. Adicione --env-name gym_pusht/PushT-v0 e --policy-path lerobot/act_pusht_keypoints para gravar demonstrações roteirizadas (não humanas) para um conjunto de dados de referência.
Quantas Demonstrações?
O número certo depende da sua configuração:
- Simulação: 50 episódios roteirizados são suficientes para uma política de referência. O ambiente é determinístico, então a variância é baixa e 50 é o suficiente para o ACT convergir.
- Robô real, tarefa simples: 50–80 demonstrações humanas. Um pick-and-place com uma posição de objeto fixa pode treinar bem na extremidade inferior desse intervalo se suas demonstrações forem consistentes.
- Robô real, tarefa variável: 100–200 demonstrações. Se as posições dos objetos variarem, ou se a tarefa exigir múltiplos subpassos, você precisará de mais cobertura.
Para este caminho, alvo 50 demonstrações no mínimo. Qualidade supera quantidade — 50 demonstrações consistentes superam 150 imprecisas todas as vezes.
Boas Práticas de Demonstração
Configuração de espaço de trabalho consistente
Redefina os objetos para a mesma posição antes de cada episódio. Use fita na mesa para marcar as posições iniciais. A política aprenderá com a distribuição de posições em suas demonstrações — se todas estiverem no mesmo lugar, a política será calibrada para esse lugar.
Episódios completos e inteiros
Cada episódio deve começar na mesma pose inicial e terminar com a tarefa completamente concluída. Não pare a gravação no meio da tarefa. Um episódio incompleto, onde o gripper está no meio de uma apreensão, ensina ao modelo um comportamento quebrado.
Movimentos deliberados e suaves
Mova a 40–60% da velocidade máxima. Lento o suficiente para ser suave, rápido o suficiente para não ser tremido. O modelo aprende o tempo a partir de suas demonstrações — velocidade errática produz políticas erráticas.
Demonstrações parciais ou abortadas
Se você deixar o objeto cair, colidir com o espaço de trabalho ou acionar um erro, pressione Ctrl+C para abortar o episódio. O episódio será descartado. Nunca empurre um episódio abortado — isso contamina o conjunto de dados.
Estratégias inconsistentes
Não misture estratégias: não agarre pela esquerda em algumas demonstrações e pela direita em outras. Escolha uma abordagem e use-a para cada episódio. O CVAE do ACT aprende um único "estilo" — a inconsistência força-o a fazer uma média, produzindo nenhuma estratégia de forma confiável.
Envie para o HuggingFace Hub
Se você não configurou --dataset.push-to-hub 1 durante a gravação, pressione manualmente após a sessão:
--private 1 ao comando de push. Conjuntos de dados públicos contribuem para a comunidade de robótica e podem ser destacados na Biblioteca de conjuntos de dados SVRC.
Unidade 3 Completa Quando...
Você tem pelo menos 50 demonstrações completas e não abortadas em um conjunto de dados LeRobot no HuggingFace Hub. Você pode carregar seu conjunto de dados com LeRobotDataset("your-username/pick-place-v1") e ver o número esperado de episódios. Você visualizou pelo menos 5 de seus próprios episódios usando lerobot.scripts.visualize_dataset e confirmou que as trajetórias das juntas parecem suaves e as mudanças de estado do gripper são limpas. Você está pronto para treinar na Unidade 4.