Referências de Aprendizado de Robôs

Avaliação padronizada para manipulação de robôs — RLBench, LIBERO, CALVIN e mais. Taxas de sucesso, conclusão de tarefas, métricas de avaliação.

Conjuntos de tarefas para avaliação reprodutível com foco em simulação.

Referências focadas em implantação incorporada e robustez.

Referências que enfatizam a fundamentação de instruções e composição de tarefas.

Navegação Rápida

Categorias Populares

Tags rápidas

Avaliação

Filtrar conjuntos de benchmark por ambiente e foco de avaliação.

100+ tarefas de manipulação no PyRep. Amplamente utilizado para avaliação VLA. BridgeVLA 88,2%, InternVLA 95%+ em subconjuntos.

Benchmark de aprendizado ao longo da vida. 130 tarefas, pacotes espaciais/objetos/objetivos. RoboSuite. 95,9% SOTA (InternVLA).

Compondo Ações a partir de Linguagem e Visão. Longo horizonte, condicionado pela linguagem. RoboFlamingo forte baseline.

Manipulação no mundo real. 700+ tarefas. WidowX, várias implementações. Taxa de sucesso, avaliação multi-tarefa.

Benchmark de robô real em grande escala. Tarefas e ambientes diversos. BridgeVLA 64%.

Ativos Vinculados

Os benchmarks são agrupados para verificações de desempenho equivalentes.

Avaliar tanto configurações controladas quanto orientadas para implantação.

Cada caminho de benchmark se conecta a famílias de modelos compatíveis.

Suporte para captura de dados e operações de avaliação quando necessário.

Fornecemos suporte para coleta de dados e avaliação no mundo real.