役職
SO-101 教室データセットの隠れた問題は、キャプチャの品質だけでなく、ラベル付けの一貫性にもあります。異なる人が同じラベルの単語をわずかに異なる方法で使用するため、後のトレーニングと評価に悪影響を及ぼします。
多くの教室でのデモや学生チーム間でデータセットのラベルの一貫性をどのように維持していますか?
データセットが乱雑になりすぎてセッション間で比較できない前に、ラベルを定義し、エッジケースを確認し、不一致を検出する方法を共有してください。
返信する場合は、ラベル付けの不一致を 1 つ正確に含め、ラベルの一貫性を高めたルールまたはレビュー手順を 1 つ正確に含めてください。