Postar
Um problema oculto nos conjuntos de dados da sala de aula SO-101 não é apenas a qualidade da captura, mas a consistência na rotulagem: pessoas diferentes usam as mesmas palavras de rótulo de maneiras ligeiramente diferentes, o que prejudica o treinamento e a avaliação posteriormente.
Como você está mantendo os rótulos dos conjuntos de dados consistentes em muitas demonstrações em sala de aula ou equipes de alunos?
Por favor, compartilhe como você define rótulos, revisa casos extremos e captura inconsistências antes que um conjunto de dados se torne muito bagunçado para comparar entre sessões.
Se você responder, inclua um desacordo exato de rotulagem e uma regra ou etapa de revisão exata que tornou os rótulos mais consistentes.