Служба окружающей среды РЛ

Реальная среда обучения для команд, которым нужно больше, чем просто моделирование

Устойчивые, готовые к обучению роботизированные среды, подкрепленные реальным оборудованием, настоящими датчиками и реальной оперативной поддержкой для RL, оценки и итерации.

Изучите среду RL Запросить услуги передачи данных Посмотреть платформу данных

Реальное оборудование Контролируемый отказ Повторяемый сброс Готовые к тестированию сигналы

Что это значит

Не симулятор. Постоянно работающая реальная установка.

В нашем контексте среда RL — это полностью специфицированная реальная роботизированная система: физическая настройка, четко определенные задачи и критерии успеха, стабильные пространства для наблюдения и действий, детерминированные процедуры сброса, непрерывная регистрация и безопасное выполнение при повторяющихся испытаниях и неудачах.

Это дает командам возможность обучать, оценивать и повторять политики, основанные на обучении, в реальном мире, вместо того, чтобы рассматривать развертывание как первое настоящее испытание.

Определите задачу

Заблокируйте задачу, критерии успеха, процесс сброса и интерфейсы наблюдения или действия.

Запуск повторных испытаний

Используйте одну и ту же реальную настройку в тысячах эпизодов с повторяемой инициализацией.

Фиксируйте обучающие сигналы

Записывайте состояния суставов, команды управления, зрение, тактильные или силовые сигналы и результаты.

Улучшить политику

Используйте реальные сбои, реальные крайние случаи и отслеживание регрессии для перехода к следующей версии.

Что мы предоставляем

Компоненты среды, готовые к производству

Устойчивые реальные средыСпециальная настройка, многократное выполнение эпизодов, долгосрочное отслеживание производительности и поддержка эксплуатационной безопасности.
Сигналы готовности к обучениюСостояния суставов, команды управления, проприоцепция, зрение RGB и RGB-D, силовые и тактильные сигналы, а также явные метки результатов.
Контролируемый отказ в масштабеБезопасно фиксируйте неудачные захваты, проскальзывания, столкновения и попытки восстановления в виде первоклассных данных.

Примеры сред

Где это используется

Контактные манипуляции - Изменчивость трения, тактильная вставка, обнаружение скольжения и восстановление
RL с загрузкой телеоперации - человеческие демонстрации плюс тонкая настройка RL онлайн или оффлайн
Регрессионные и эталонные среды - фиксированные задачи, повторяемые сбросы и метрики оценки с контролем версий.

Модели взаимодействия

Способы работы с SVRC

Пилотная средаКраткосрочная установка, проверка осуществимости и совместная разработка среды и задач.
Постоянная средаВыделенное оборудование и настройка задач с постоянным доступом ежемесячно или ежеквартально.
Интегрированное партнерствоМножество сред, постоянный рост набора данных, пользовательские метрики и рабочие процессы отчетности.

Готовы начать?

Приобретайте роботов, запрашивайте данные или обращайтесь — мы здесь, чтобы помочь.

Получить робота Запросить данные Связаться с нами