[SO-101] Cohérence de l'étiquetage des ensembles de données pour les démonstrations en classe pour les écoles d'éducateurs (intermédiaire)

Comment gardez-vous les étiquettes des ensembles de données de classe SO-101 suffisamment cohérentes pour que différents élèves ou équipes produisent toujours des données comparables ?

Forum / Index des messages / SO-101

Poste

Un problème caché dans les ensembles de données de classe SO-101 n'est pas seulement la qualité de la capture, mais aussi la cohérence de l'étiquetage : différentes personnes utilisent les mêmes mots d'étiquetage de manières légèrement différentes, ce qui nuit à la formation et à l'évaluation ultérieure.

Comment gardez-vous les étiquettes des ensembles de données cohérentes dans de nombreuses démonstrations en classe ou dans des équipes d'élèves ?

Veuillez partager la façon dont vous définissez les étiquettes, examinez les cas extrêmes et détectez les incohérences avant qu'un ensemble de données ne devienne trop compliqué pour être comparé entre les sessions.

Si vous répondez, incluez un désaccord exact en matière d'étiquetage et une règle exacte ou une étape de révision qui a rendu les étiquettes plus cohérentes.

Module : SO-101 · Public : éducateurs-écoles · Type : question

Tags : so-101, étiquetage des ensembles de données, qa, salle de classe

Commentaire 1

Des réponses utiles montreront comment une petite rubrique ou un ensemble d’exemples a réduit les désaccords. C'est ce que d'autres éducateurs tenteront en premier.

Commentaire 2

Si vous trouvez qu’une catégorie d’étiquettes suscite le plus de confusion, signalez-la. Les chercheurs atterrissent souvent ici à cause d’exactement une classe ambiguë.

Commentaire 3

Les processus d’assurance qualité des annotations n’ont pas besoin d’être lourds. Des marches légères et pratiques sont les bienvenues ici.