Transformer 정책 - 로봇 학습 용어집

정의

Transformer 기반 정책은 로봇 제어에 주의 메커니즘을 적용합니다. 통합된 시퀀스 모델을 통해 이미지, 고유 감각, 언어 지시, 행동 기록 등 이질적인 입력을 처리할 수 있습니다. 주요 아키텍처에는 RT-1(EfficientNet 비전을 사용한 토큰화된 작업), RT-2(VLM 백본), ACT(양방향 제어를 위한 작업 청킹 변환기) 및 Octo(확장 가능한 교차 구현 변환기)가 포함됩니다. Transformer는 가변 길이 컨텍스트와 다중 작업 조건을 자연스럽게 처리합니다. 로봇 공학의 주요 과제는 추론 대기 시간입니다. 10~50Hz의 실시간 제어에는 컴퓨팅 비용을 절감하기 위한 효율적인 모델 설계 또는 작업 청크가 필요합니다.

로봇 팀에 중요한 이유

실제 로봇 시스템을 구축하는 팀에게는 변압기 정책을 이해하는 것이 필수적입니다. 데모 데이터를 수집하든, 시뮬레이션에서 정책을 교육하든, 프로덕션에 배포하든 이 개념은 작업 흐름과 시스템 설계에 직접적인 영향을 미칩니다.

변압기 정책

정의

로봇 팀에 중요한 이유

관련 페이지

기초 모델

액션 청킹

로봇공학 아카데미

연구 논문