Publicar
Un problema oculto en los conjuntos de datos del aula de SO-101 no es solo la calidad de captura, sino la consistencia en el etiquetado: diferentes personas usan las mismas palabras de etiqueta de maneras ligeramente diferentes, lo que perjudica el entrenamiento y la evaluación más adelante.
¿Cómo mantienes las etiquetas de los conjuntos de datos consistentes en muchas demostraciones en el aula o equipos de estudiantes?
Por favor, comparte cómo defines las etiquetas, revisas casos límite y detectas inconsistencias antes de que un conjunto de datos se vuelva demasiado desordenado para comparar entre sesiones.
Si respondes, incluye un desacuerdo exacto en el etiquetado y una regla o paso de revisión exacto que hizo que las etiquetas fueran más consistentes.