우편
SO-101 강의실 데이터 세트의 숨겨진 문제는 캡처 품질뿐만 아니라 라벨링 일관성입니다. 서로 다른 사람들이 동일한 라벨 단어를 약간 다른 방식으로 사용하므로 나중에 교육 및 평가에 해를 끼칩니다.
여러 강의실 데모 또는 학생 팀에서 데이터세트 레이블을 어떻게 일관되게 유지하고 있나요?
데이터세트가 너무 지저분해져서 세션 간 비교할 수 없게 되기 전에 라벨을 정의하고, 극단적인 사례를 검토하고, 불일치를 파악하는 방법을 공유해 주세요.
답변할 경우 정확한 라벨링 불일치 사항 하나와 라벨의 일관성을 높이는 정확한 규칙 또는 검토 단계 하나를 포함하세요.