Модели роботов VLA и VLM с открытым исходным кодом

Кураторский каталог моделей Vision-Language-Action (VLA) и Vision-Language (VLM) с открытым исходным кодом для манипулирования роботами — со ссылками на официальные сайты, GitHub и Hugging Face.

Коллекция

Базовые модели VLA

Крупномасштабные модели действий, обученные с использованием данных нескольких роботов и многозадачных задач.

Коллекция

Трек сравнения моделей

Модели, обычно используемые для параллельной оценки в стиле бенчмарка.

Коллекция

Модели обучения политике

Архитектуры, оптимизированные для практических циклов обучения политике IL/RL.

Тематические кластеры

Руководства по модели с высоким намерением

На этих страницах пользователи ищут информацию по вопросам развертывания, рабочему процессу или коммерческому решению, а не по конкретному названию модели.

Руководство по модели

Модели VLA для робототехники

Базовые модели действий, компромиссы и соответствие.

Руководство по рабочему процессу

Модели начальной загрузки Teleop

Что работает лучше всего, когда вашей отправной точкой являются демонстрации.

Руководство по манипуляциям

Модели с большим количеством контактов

Сила, тактильные сигналы и выбор политики восстановления.

Руководство по принятию решений

Политика фундамента против задачи

Широкие возможности по сравнению с более быстрым узким развертыванием.

Руководство по принятию решений

Как выбрать модель робота

Данные, объем задач, оценка и ограничения развертывания.

Руководство по OpenArm

Модели OpenArm

Выбор политики и практические стартовые пути для OpenArm.

Быстрый просмотр

Модели VLA и VLM для робототехники

У каждой модели есть отдельная страница с описанием, архитектурой, тестами и официальными ссылками.

Предварительный просмотр моделей OpenVLA

КОРЛ 2025

7Б-параметр ВЛА. Лама 2 + DINOv2/SigLIP. 970 тысяч демо-версий от Open X-Embodiment. Превосходит RT-2-X с в 7 раз меньшим количеством параметров. Массачусетский технологический институт, «Обнимающее лицо».

Посмотреть модель →

2024

Окто

Политика распространения трансформаторов. Параметры 27M/93M. 800 тысяч траекторий. Мультиробот, кондиционирование языка/цели. Массачусетский технологический институт, «Обнимающее лицо».

Посмотреть модель →

Гугл ДипМайнд

РТ-Х / РТ-1-Х

Откройте модели X-Embodiment. Контрольные точки JAX и TensorFlow. Мультиробот с языковым управлением. Апач 2.0.

Посмотреть модель →

Шанхайская лаборатория искусственного интеллекта

СтажерВЛА-М1

Пространственно управляемая ВЛА. Двухступенчатый: заземление + действие. 71–81% на Google Robot, 95,9% LIBERO. Массачусетский технологический институт, «Обнимающее лицо».

Посмотреть модель →

ByteDance / Синьхуа

РобоФламинго

VLM на базе OpenFlamingo для управления роботами. Политика руководителя + имитационное обучение. Сильный по отношению к CALVIN. Массачусетский технологический институт, «Обнимающее лицо».

Посмотреть модель →

НейрИПС 2025

МостВЛА

3D VLA с выравниванием ввода-вывода. 88,2% RLBench, 64% COLOSSEUM. Предварительная тренировка тепловой карты + точная настройка облака точек.

Посмотреть модель →

Визуализация модели политики распространения

Колумбия

Политика распространения

Зрительно-моторная политика как шумоподавительная диффузия. +46,9% по сравнению с предыдущими методами. Уходящий горизонт, преобразователь временных рядов. Открытый исходный код.

Посмотреть модель →

Обнимающее лицо

ЛеРобот

Каркас + АКТ, СмолВЛА (450М). Сквозной ИЛ/РЛ. Наборы данных, обучение, развертывание. PyTorch, Hugging Face Hub.

Посмотреть модель →

Связанные активы

Наборы данных и инструменты для сопряжения

Практический выбор модели

Сравнивайте архитектуры по степени соответствия задачам, потребностям в данных и сложности развертывания.

Выравнивание модели данных

Выбор моделей связан с совместимыми стеками наборов данных и форматов.

Скорость эксперимента

Ссылки с открытым исходным кодом и готовые к реализации указатели уменьшают сложность настройки.

Масштабирование до производства

От оценки до развертывания с поддержкой настройки и интеграции.

Нужны специальные модели или данные?

Мы обеспечиваем сбор данных, поддержку тонкой настройки и развертывание для обучения роботов.

Службы передачи данных Связаться с нами

Модели роботов VLA и VLM с открытым исходным кодом

Базовые модели VLA

Трек сравнения моделей

Модели обучения политике

Руководства по модели с высоким намерением

Модели VLA для робототехники

Модели начальной загрузки Teleop

Модели с большим количеством контактов

Политика фундамента против задачи

Как выбрать модель робота

Модели OpenArm

Популярные категории

Популярные теги

Модели VLA и VLM для робототехники

OpenVLA

Окто

РТ-Х / РТ-1-Х

СтажерВЛА-М1

РобоФламинго

МостВЛА

Политика распространения

ЛеРобот

Наборы данных и инструменты для сопряжения

Практический выбор модели

Выравнивание модели данных

Скорость эксперимента

Масштабирование до производства

Нужны специальные модели или данные?