Poste
Un problème caché dans les ensembles de données de classe SO-101 n'est pas seulement la qualité de la capture, mais aussi la cohérence de l'étiquetage : différentes personnes utilisent les mêmes mots d'étiquetage de manières légèrement différentes, ce qui nuit à la formation et à l'évaluation ultérieure.
Comment gardez-vous les étiquettes des ensembles de données cohérentes dans de nombreuses démonstrations en classe ou dans des équipes d'élèves ?
Veuillez partager la façon dont vous définissez les étiquettes, examinez les cas extrêmes et détectez les incohérences avant qu'un ensemble de données ne devienne trop compliqué pour être comparé entre les sessions.
Si vous répondez, incluez un désaccord exact en matière d'étiquetage et une règle exacte ou une étape de révision qui a rendu les étiquettes plus cohérentes.