Реальная среда обучения для команд, которым нужно больше, чем просто моделирование

Устойчивые, готовые к обучению роботизированные среды, подкрепленные реальным оборудованием, настоящими датчиками и реальной оперативной поддержкой для RL, оценки и итерации.

Реальное оборудование Контролируемый отказ Повторяемый сброс Готовые к тестированию сигналы
Что это значит

Не симулятор. Постоянно работающая реальная установка.

В нашем контексте среда RL — это полностью специфицированная реальная роботизированная система: физическая настройка, четко определенные задачи и критерии успеха, стабильные пространства для наблюдения и действий, детерминированные процедуры сброса, непрерывная регистрация и безопасное выполнение при повторяющихся испытаниях и неудачах.

Это дает командам возможность обучать, оценивать и повторять политики, основанные на обучении, в реальном мире, вместо того, чтобы рассматривать развертывание как первое настоящее испытание.

1

Определите задачу

Заблокируйте задачу, критерии успеха, процесс сброса и интерфейсы наблюдения или действия.

2

Запуск повторных испытаний

Используйте одну и ту же реальную настройку в тысячах эпизодов с повторяемой инициализацией.

3

Фиксируйте обучающие сигналы

Записывайте состояния суставов, команды управления, зрение, тактильные или силовые сигналы и результаты.

4

Улучшить политику

Используйте реальные сбои, реальные крайние случаи и отслеживание регрессии для перехода к следующей версии.

Что мы предоставляем

Компоненты среды, готовые к производству

  • Устойчивые реальные средыСпециальная настройка, многократное выполнение эпизодов, долгосрочное отслеживание производительности и поддержка эксплуатационной безопасности.
  • Сигналы готовности к обучениюСостояния суставов, команды управления, проприоцепция, зрение RGB и RGB-D, силовые и тактильные сигналы, а также явные метки результатов.
  • Контролируемый отказ в масштабеБезопасно фиксируйте неудачные захваты, проскальзывания, столкновения и попытки восстановления в виде первоклассных данных.
Примеры сред

Где это используется

  • Контактные манипуляции - Изменчивость трения, тактильная вставка, обнаружение скольжения и восстановление
  • RL с загрузкой телеоперации - человеческие демонстрации плюс тонкая настройка RL онлайн или оффлайн
  • Регрессионные и эталонные среды - фиксированные задачи, повторяемые сбросы и метрики оценки с контролем версий.
Модели взаимодействия

Способы работы с SVRC

  • Пилотная средаКраткосрочная установка, проверка осуществимости и совместная разработка среды и задач.
  • Постоянная средаВыделенное оборудование и настройка задач с постоянным доступом ежемесячно или ежеквартально.
  • Интегрированное партнерствоМножество сред, постоянный рост набора данных, пользовательские метрики и рабочие процессы отчетности.

Готовы начать?

Приобретайте роботов, запрашивайте данные или обращайтесь — мы здесь, чтобы помочь.