شرح بيانات الروبوت: كيفية تصنيف عروض الروبوت للتدريب
التعليقات التوضيحية هي الجزء الأقل بريقًا في تعلم الروبوت والأكثر أهمية. إن مجموعة البيانات المكونة من 500 عرض توضيحي مشروحة بشكل جيد سوف تدرب سياسة أفضل من 2000 عرض توضيحي سيئ التصنيف. إليك ما يعنيه التعليق التوضيحي لبيانات الروبوت وكيفية القيام بذلك بشكل صحيح.
ماذا يعني التعليق التوضيحي لبيانات الروبوت
على عكس تصنيف الصور، حيث تعني التعليقات التوضيحية رسم المربعات أو النقر فوق الملصقات، فإن التعليقات التوضيحية التوضيحية للروبوت تكون أكثر ثراءً وتنظيمًا. يجب تصنيف حلقة روبوت واحدة - عادةً ما تتراوح مدتها من 20 إلى 200 ثانية من المعالجة - على مستويات متعددة: هل كانت الحلقة ناجحة أم فاشلة، وما هي اللغة التي تصف المهمة، وأين تبدأ وتنتهي المراحل المميزة لغويًا، وهل هناك أي إطارات يجب استبعادها من التدريب بسبب أخطاء في الأجهزة أو أخطاء المشغل.
عادةً ما يتم إجراء التعليق التوضيحي من قبل المراجعين البشريين الذين يشاهدون إعادة تشغيل الفيديو للحلقات المسجلة جنبًا إلى جنب مع قطع من الحالات المشتركة وفتحة القابض. تعرض أدوات التعليقات التوضيحية الجيدة فيديو متزامنًا من كاميرات متعددة في وقت واحد، مما يجعل من السهل الحكم على النجاح من وجهات نظر قد لا تلتقطها كاميرات الروبوت بوضوح.
أعلام النجاح: الشرح الأكثر أهمية
يجب أن يتم تصنيف كل حلقة في مجموعة بيانات تدريب الروبوت بعلامة نجاح ثنائية: هل أكمل الروبوت المهمة بنجاح. قد يبدو هذا بسيطًا، ولكن يجب تحديد معايير النجاح بدقة قبل بدء التعليق التوضيحي. يتطلب "وضع الكوب على اللوحة" مواصفات: هل يجب أن يكون الكوب في وضع مستقيم، وهل اتجاه المقبض مهم، وما مقدار الخطأ الموضعي المقبول؟ يقوم المعلقون الذين يطبقون معايير ضمنية مختلفة على نفس مجموعة البيانات بإنشاء تسميات مزعجة تؤدي إلى انخفاض أداء التدريب.
اكتب وثيقة مواصفات النجاح المكونة من صفحة واحدة قبل بدء التعليق التوضيحي، مع أمثلة لصور حالات النجاح والفشل. استخدم هذا المستند لمعايرة التعليقات التوضيحية. قم بقياس الاتفاق بين المعلقين على مجموعة فرعية مشتركة من الحلقات - إذا كان الاتفاق أقل من 90%، فإن معايير النجاح الخاصة بك تحتاج إلى توضيح. يتطلب خط أنابيب التعليقات التوضيحية الخاص بـ SVRC مستندات معايير نجاح واضحة وفحوصات اتفاق بين المعلقين قبل وضع علامة على أي مجموعة بيانات جاهزة للتدريب.
تسميات اللغة
تُرفق التعليقات التوضيحية للغة أوصاف اللغة الطبيعية بالحلقات أو مقاطع الحلقة. هذه مطلوبة لتدريب السياسات المشروطة باللغة - السياسات التي تتبع تعليمات مثل "التقاط الكتلة الحمراء" بدلاً من جعل المهمة مشفرة. تتيح التعليقات التوضيحية اللغوية أيضًا التوافق مع نماذج لغة الرؤية والإجراء (VLA) وتسمح بالبحث في مجموعات البيانات وتصفيتها حسب وصف المهمة.
اكتب التعليقات التوضيحية للغة على مستويين من الخصوصية: اسم مهمة قصير ("وضع الكوب") وتعليمات اللغة الطبيعية ("التقط الكوب الأبيض وضعه على اللوحة الزرقاء"). يجب أن تصف التعليمات ما يراه المراقب البشري يحدث، وليس الحالة الداخلية للروبوت. إذا كانت مهمتك تتضمن أشكالًا مختلفة من المهام - كائنات مختلفة ومواقع مستهدفة مختلفة - فيجب أن يكون لكل شكل مختلف تعليمات مقابلة تميزه عن الآخرين.
تجزئة المهام
بالنسبة للمهام طويلة المدى التي تتضمن مهام فرعية متسلسلة متعددة، تحدد تسميات التجزئة الحدود بين المراحل. يمكن تقسيم مهمة إعداد الطاولة إلى: الوصول إلى الكوب، وكوب الإمساك، وكوب النقل، ووضع الكوب، وتحرير الكوب. يتيح التقسيم التدريب على السياسات الهرمية، ومقاييس النجاح على مستوى المهام الفرعية، وزيادة البيانات الانتقائية. كما أنه يتيح التصحيح الجراحي للأخطاء: إذا فشلت السياسة أثناء النقل ولكنها نجحت أثناء الاستيعاب، تتيح لك تسميات التجزئة قياس معدلات نجاح المهام الفرعية واستهداف جهود جمع البيانات حيث تشتد الحاجة إليها.
يعد التعليق التوضيحي للتجزئة أكثر تكلفة من وضع علامة النجاح وليس ضروريًا دائمًا. قم بإعطاء الأولوية للتجزئة للمهام التي تحتوي على ثلاث مراحل مختلفة لغويًا أو أكثر، أو عندما تخطط لاستخدام بنية سياسة هرمية.
أدوات الشرح ومعايير الجودة
تشتمل أدوات التعليقات التوضيحية الشائعة لبيانات الروبوت على Label Studio (مفتوح المصدر، ويدعم بيانات الفيديو والسلاسل الزمنية)، وCVAT (أداة التعليقات التوضيحية لرؤية الكمبيوتر، وهي جيدة لتراكبات المربع المحيط)، ومتصفحات الحلقات المخصصة المبنية باستخدام Gradio أو Streamlit. تتضمن منصة بيانات SVRC واجهة مدمجة للتعليق التوضيحي للحلقة يمكن الوصول إليها من خلال تطبيق الويب، ودعم علامات النجاح، وتسميات اللغة، وعلامات الاستبعاد على مستوى الإطار.
معايير الجودة أهم من الكمية. يطبق SVRC بوابة جودة من ثلاث مراحل على جميع مجموعات البيانات: التعليق التوضيحي الذاتي للمشغل مباشرة بعد التسجيل، والمراجعة الثانوية بواسطة معلق توضيحي مدرب، وفحوصات الاتساق الآلية التي تقارن التعليقات التوضيحية مع إحصائيات الحالة المشتركة (على سبيل المثال، تم وضع علامة على الحلقات التي تميزت بالنجاح حيث لم يتم إغلاق القابض مطلقًا لإعادة المراجعة).
خط أنابيب التعليقات التوضيحية لـ SVRC
عند استخدام SVRC خدمات جمع البيانات، الشرح هو جزء من التسليم. يقوم المشغلون لدينا بتعليق كل حلقة بعلامات النجاح وتسميات اللغة أثناء جلسة التسجيل، ويقوم فريق التعليقات التوضيحية لدينا بإجراء مراجعة ثانوية قبل تصدير مجموعة البيانات. ستتلقى مجموعة بيانات تحتوي على تعليقات توضيحية عالية الثقة، ونتائج اتفاق التعليقات التوضيحية، وتقرير جودة كامل. بالنسبة للفرق التي تقوم بإحضار البيانات المجمعة الخاصة بها، تقدم SVRC خدمات التعليقات التوضيحية فقط ويمكنها معالجة مجموعات البيانات الموجودة التي تم جمعها على أي منصة أجهزة مدعومة. اتصل بنا لمناقشة احتياجات التعليقات التوضيحية لمجموعة البيانات الخاصة بك.