لماذا يهم اختيار التنسيق
يحدد تنسيق مجموعة البيانات النماذج التي يمكنك تدريبها، ومدى سهولة مشاركة البيانات مع المتعاونين، ومقدار النفقات الهندسية التي تواجهها في المسار الخاص بك. إن اختيار التنسيق الخاطئ يعني إجراء تحويل مؤلم لاحقًا - أو ما هو أسوأ من ذلك، فقدان البيانات الوصفية في الترجمة.
مقارنة التنسيق
RLDS (Google): يعتمد على TFRecord، ويستخدم بواسطة Open X-Embodiment وRT-X. ممتاز للتدريب على التجسيد المتقاطع على نطاق واسع. LeRobot (الوجه المعانق): يعتمد على الباركيه، وسهل الدفع إلى Hugging Face Hub، ويتزايد اعتماد المجتمع عليه. HDF5: تنسيق ثنائي ذاتي الوصف، يستخدمه RoboMimic والعديد من المشاريع القديمة. Zarr: مقسمة، صديقة للسحابة، تكتسب قوة جذب لمجموعات البيانات الكبيرة.
- للتدريب على التجسيد المتقاطع: RLDS
- للمشاركة المجتمعية والتكرار السريع: LeRobot
- للتوافق القديم: HDF5
- بالنسبة لخطوط الأنابيب السحابية الأصلية: Zarr
خط أنابيب بيانات SVRC
تعمل البنية التحتية لجمع البيانات في SVRC على إخراج تنسيقات RLDS وLeRobot محليًا. تتعامل منصة البيانات الخاصة بنا مع تحويل التنسيق وإصدار الإصدارات والتحقق من الجودة تلقائيًا.