डाक
SO-101 कक्षा डेटासेट में एक छिपी हुई समस्या न केवल गुणवत्ता पर कब्जा करना है, बल्कि लेबलिंग स्थिरता भी है: अलग-अलग लोग एक ही लेबल शब्दों का थोड़ा अलग तरीके से उपयोग करते हैं, जो बाद में प्रशिक्षण और मूल्यांकन को नुकसान पहुंचाता है।
आप कई कक्षा डेमो या छात्र टीमों में डेटासेट लेबल को एक समान कैसे रख रहे हैं?
कृपया साझा करें कि आप लेबल को कैसे परिभाषित करते हैं, किनारे के मामलों की समीक्षा करते हैं और असंगतता को पकड़ते हैं, इससे पहले कि कोई डेटासेट सत्रों में तुलना करने के लिए बहुत गड़बड़ हो जाए।
यदि आप उत्तर देते हैं, तो एक सटीक लेबलिंग असहमति और एक सटीक नियम या समीक्षा चरण शामिल करें जिसने लेबल को अधिक सुसंगत बना दिया है।