Visão Geral da Arquitetura do Pipeline
Um pipeline de coleta de dados de qualidade de produção tem cinco estágios: configuração de hardware (robô + sensores + interface de teleoperação), software de gravação (captura multimodal sincronizada), backend de armazenamento (formato de episódio estruturado), controle de qualidade (filtragem automatizada + revisão humana) e empacotamento de conjunto de dados (RLDS, LeRobot ou formato personalizado).
Requisitos de hardware
Configuração mínima viável: braço robótico com codificadores de junta, câmera RGB montada no pulso (640×480, 30fps) e dispositivo de teleoperação (SpaceMouse, controlador VR ou braço líder). Adições recomendadas: câmera de cena externa, sensor de força-torque no pulso e câmera de profundidade. As estações de coleta de dados do SVRC incluem todos os sensores recomendados pré-configurados e calibrados.
Pilha de Software
Use ROS 2 para sincronização e gravação de sensores. Armazene episódios no formato RLDS para compatibilidade com Open X-Embodiment e LeRobot. Implemente verificações de qualidade automatizadas: limites de duração do episódio, outliers de magnitude de ação, rotulagem de sucesso/falha e detecção de oclusão de câmera. Versione seu conjunto de dados com DVC ou git-lfs para reprodutibilidade.
Escalando de 100 para 10.000 Episódios
A transição de prova de conceito para dados em escala de produção requer estações de coleta paralelas, agendamento de operadores e painéis de controle de qualidade centralizados. A equipe de Serviços de Dados do SVRC coletou mais de 50.000 episódios em várias plataformas de robôs. Entre em contato conosco para programas piloto.