함대 규모가 중요한 이유

현재 VLA 모델을 잘 일반화하려면 50K~500K 데모가 필요합니다. 단일 로봇으로 이 볼륨을 수집하는 데는 몇 달 또는 몇 년이 걸립니다. 5~20개의 병렬 스테이션을 갖춘 대규모 데이터 수집은 일정을 몇 주로 단축할 수 있습니다. Google은 RT-1 데이터 수집을 위해 13개의 로봇을 사용했습니다. Open X-Embodiment 프로젝트는 여러 실험실에 걸쳐 22개 로봇 유형의 데이터를 집계했습니다.

하드웨어 표준화

함대의 모든 로봇은 호환 가능한 데이터를 생성해야 합니다. 이를 위해서는 동일한 카메라 모델, 장착 위치, 보정 절차, 그리퍼 유형 및 제어 인터페이스가 필요합니다. 작은 변화(카메라 각도 오프셋 5°)도 정책 성과를 저해할 수 있습니다. 마스터 교정 지그를 사용하고 참조 에피소드와 비교하여 각 스테이션을 확인합니다.

운영자 파이프라인

생산 데이터를 수집하기 전에 작업자에게 검증 작업을 교육합니다. 운영자별 지표를 추적합니다: 시간당 에피소드, 성공률, 작업 완료 시간. 편견을 방지하기 위해 작업 전반에 걸쳐 연산자를 순환합니다. SVRC는 숙련된 운영자와 표준화된 품질 파이프라인을 통해 턴키 차량 데이터 수집 서비스를 제공합니다.