[TRLC-DK1] 빌더 연구소를 위한 실패 재생 및 잘못된 에피소드 분류(고급)

잘못된 DK1 에피소드를 어떻게 검토하고 여전히 유용한 데이터인지, 라벨을 다시 지정해야 하는지, 아니면 폐기해야 하는지 결정합니까?

법정 / 게시물 색인 / TRLC-DK1

우편

DK1 팀은 결국 의심스러운 실행 더미를 축적합니다. 일부는 유용한 실패이고 일부는 손상된 캡처이며 일부는 리플레이 도구가 약하기 때문에 나빠 보입니다.

실패한 DK1 에피소드를 어떻게 분류하고 실패 재생을 사용하여 무엇을 유지할지, 레이블을 다시 지정하거나 삭제할지 결정하고 있습니까?

잘못된 실행을 재생하는 방법, 먼저 검사하는 메타데이터 또는 신호, 실패가 훈련이나 평가에 여전히 유용한 시기를 공유해 주세요.

답장을 보내려면 나쁜 에피소드에 대한 결정을 바꾼 정확한 재생 단서를 하나 포함하세요.

모듈: TRLC-DK1 · 대상: builders-labs · 유형: 질문

태그: dk1, 실패-재생, 선별, 데이터 세트

코멘트 1

가장 강력한 답변은 기억에 남는 하나의 실패 사례가 아니라 다른 실험실에서 복사할 수 있는 분류 워크플로를 설명하는 것입니다.

코멘트 2

재생 중에만 캡처 버그를 발견한 경우 먼저 이를 노출시킨 신호가 무엇인지 정확히 말하십시오. 해당 세부정보는 검색 가능성이 높습니다.

코멘트 3

검색자는 또한 실패가 유지하기에 충분한 정보를 제공하는지 알고 싶어하므로 이에 대한 규칙도 포함하십시오.