Unidade 3: Grave Suas Próprias Demonstrações — Caminho de Aprendizado LeRobot

Conecte Seu Robô ou Abra a Simulação

Se você estiver usando um robô real, conecte-o agora e confirme que ele é reconhecido pelo seu sistema antes de executar o comando de gravação. Se você estiver trabalhando em simulação, o comando de gravação pode controlar um robô virtual no gym_pusht ou gym_aloha ambientes usando um teclado ou política scriptada como fonte de teleoperação.

# Real robot — verify connection (replace so100 with your robot type)
python -m lerobot.scripts.control_robot \

# Simulation — no hardware needed
python -m lerobot.scripts.control_robot \

Você deve ver os estados das juntas sendo transmitidos na saída do terminal e (para robôs reais) o braço respondendo à entrada. Se não, resolva o problema de conexão antes de prosseguir — gravar com um robô desconectado produz silenciosamente dados corrompidos.

O Comando de Gravação

O comando principal de gravação. Adapte as flags para sua configuração:

python -m lerobot.scripts.control_robot \

# $HF_USER is your HuggingFace username (set via: export HF_USER=your_username)
# --dataset.push-to-hub 1 uploads automatically after each episode
# --display-cameras 1 shows live camera feeds during recording

Gravação de simulação: Substitua --robot-path pela sua configuração de simulação. Adicione --env-name gym_pusht/PushT-v0 e --policy-path lerobot/act_pusht_keypoints para gravar demonstrações roteirizadas (não humanas) para um conjunto de dados de referência.

Quantas Demonstrações?

O número certo depende da sua configuração:

Simulação: 50 episódios roteirizados são suficientes para uma política de referência. O ambiente é determinístico, então a variância é baixa e 50 é o suficiente para o ACT convergir.
Robô real, tarefa simples: 50–80 demonstrações humanas. Um pick-and-place com uma posição de objeto fixa pode treinar bem na extremidade inferior desse intervalo se suas demonstrações forem consistentes.
Robô real, tarefa variável: 100–200 demonstrações. Se as posições dos objetos variarem, ou se a tarefa exigir múltiplos subpassos, você precisará de mais cobertura.

Para este caminho, alvo 50 demonstrações no mínimo. Qualidade supera quantidade — 50 demonstrações consistentes superam 150 imprecisas todas as vezes.

Boas Práticas de Demonstração

Configuração de espaço de trabalho consistente

Redefina os objetos para a mesma posição antes de cada episódio. Use fita na mesa para marcar as posições iniciais. A política aprenderá com a distribuição de posições em suas demonstrações — se todas estiverem no mesmo lugar, a política será calibrada para esse lugar.

Episódios completos e inteiros

Cada episódio deve começar na mesma pose inicial e terminar com a tarefa completamente concluída. Não pare a gravação no meio da tarefa. Um episódio incompleto, onde o gripper está no meio de uma apreensão, ensina ao modelo um comportamento quebrado.

Movimentos deliberados e suaves

Mova a 40–60% da velocidade máxima. Lento o suficiente para ser suave, rápido o suficiente para não ser tremido. O modelo aprende o tempo a partir de suas demonstrações — velocidade errática produz políticas erráticas.

Demonstrações parciais ou abortadas

Se você deixar o objeto cair, colidir com o espaço de trabalho ou acionar um erro, pressione Ctrl+C para abortar o episódio. O episódio será descartado. Nunca empurre um episódio abortado — isso contamina o conjunto de dados.

Estratégias inconsistentes

Não misture estratégias: não agarre pela esquerda em algumas demonstrações e pela direita em outras. Escolha uma abordagem e use-a para cada episódio. O CVAE do ACT aprende um único "estilo" — a inconsistência força-o a fazer uma média, produzindo nenhuma estratégia de forma confiável.

Envie para o HuggingFace Hub

Se você não configurou --dataset.push-to-hub 1 durante a gravação, pressione manualmente após a sessão:

# Push your completed dataset to HuggingFace Hub
python -m lerobot.scripts.push_dataset_to_hub\

# Verify it is live at:
# https://huggingface.co/datasets/$HF_USER/pick-place-v1

Visibilidade do conjunto de dados: Novos conjuntos de dados são públicos por padrão no HuggingFace Hub. Se o seu espaço de trabalho ou tarefa for sensível, adicione --private 1 ao comando de push. Conjuntos de dados públicos contribuem para a comunidade de robótica e podem ser destacados na Biblioteca de conjuntos de dados SVRC.

Unidade 3 Completa Quando...

Você tem pelo menos 50 demonstrações completas e não abortadas em um conjunto de dados LeRobot no HuggingFace Hub. Você pode carregar seu conjunto de dados com LeRobotDataset("your-username/pick-place-v1") e ver o número esperado de episódios. Você visualizou pelo menos 5 de seus próprios episódios usando lerobot.scripts.visualize_dataset e confirmou que as trajetórias das juntas parecem suaves e as mudanças de estado do gripper são limpas. Você está pronto para treinar na Unidade 4.