[TRLC-DK1] Repetição de falha e triagem de episódios ruins para laboratórios de construtores (avançado)

Como você revisa um episódio ruim do DK1 e decide se ainda é um dado útil, precisa de reetiquetagem ou deve ser descartado?

foi / Índice de Postagens / TRLC-DK1

Postar

As equipes do DK1 eventualmente acumulam uma pilha de execuções questionáveis: algumas são falhas úteis, algumas são capturas quebradas e algumas parecem ruins apenas porque a ferramenta de replay é fraca.

Como você está triando episódios falhados do DK1 e usando o replay de falhas para decidir o que manter, reetiquetar ou descartar?

Por favor, compartilhe como você reproduz execuções ruins, quais metadados ou sinais você inspeciona primeiro e quando uma falha ainda é útil para treinamento ou avaliação.

Se você responder, inclua uma pista exata de replay que mudou sua decisão sobre um episódio ruim.

Módulo: TRLC-DK1 · Público: laboratórios de construtores · Tipo: pergunta

Tags: dk1, replay-de-falhas, triagem, conjunto de dados

Comentário 1

As respostas mais fortes descreverão um fluxo de trabalho de triagem que outros laboratórios podem copiar, não apenas uma história memorável de falha.

Comentário 2

Se você descobriu um bug de captura apenas durante o replay, diga exatamente qual sinal o expôs primeiro. Esse detalhe é altamente pesquisável.

Comentário 3

Os pesquisadores também querem saber quando uma falha é informativa o suficiente para ser mantida, então inclua sua regra para isso também.