Referências de Aprendizado de Robôs
Avaliação padronizada para manipulação de robôs — RLBench, LIBERO, CALVIN e mais. Taxas de sucesso, conclusão de tarefas, métricas de avaliação.
Rota de Benchmark de Simulação
Conjuntos de tarefas para avaliação reprodutível com foco em simulação.
ColeçãoAvaliação de Robôs Reais
Referências focadas em implantação incorporada e robustez.
ColeçãoTarefas Condicionadas por Linguagem
Referências que enfatizam a fundamentação de instruções e composição de tarefas.
Categorias Populares
Tags Populares
Referências para Manipulação
RLBench
100+ tarefas de manipulação no PyRep. Amplamente utilizado para avaliação VLA. BridgeVLA 88,2%, InternVLA 95%+ em subconjuntos.
Ver referência → SimulaçãoLIBERO
Benchmark de aprendizado ao longo da vida. 130 tarefas, pacotes espaciais/objetos/objetivos. RoboSuite. 95,9% SOTA (InternVLA).
Ver referência → SimulaçãoCALVIN
Compondo Ações a partir de Linguagem e Visão. Longo horizonte, condicionado pela linguagem. RoboFlamingo forte baseline.
Ver referência → Robô RealBenchmark de Robô Google
Manipulação no mundo real. 700+ tarefas. WidowX, várias implementações. Taxa de sucesso, avaliação multi-tarefa.
Ver referência → Robô RealCOLOSSEUM
Benchmark de robô real em grande escala. Tarefas e ambientes diversos. BridgeVLA 64%.
Ver referência →Modelos e Conjuntos de Dados Sugeridos
Métricas Comparáveis
Os benchmarks são agrupados para verificações de desempenho equivalentes.
Cobertura Real vs Simulada
Avaliar tanto configurações controladas quanto orientadas para implantação.
Mapeamento de Modelos
Cada caminho de benchmark se conecta a famílias de modelos compatíveis.
Suporte à Execução
Suporte para captura de dados e operações de avaliação quando necessário.