Postar
As equipes do DK1 eventualmente acumulam uma pilha de execuções questionáveis: algumas são falhas úteis, algumas são capturas quebradas e algumas parecem ruins apenas porque a ferramenta de replay é fraca.
Como você está triando episódios falhados do DK1 e usando o replay de falhas para decidir o que manter, reetiquetar ou descartar?
Por favor, compartilhe como você reproduz execuções ruins, quais metadados ou sinais você inspeciona primeiro e quando uma falha ainda é útil para treinamento ou avaliação.
Se você responder, inclua uma pista exata de replay que mudou sua decisão sobre um episódio ruim.