تعريف
تطبق السياسات القائمة على المحولات آليات الاهتمام للتحكم في الروبوت. يمكنهم معالجة المدخلات غير المتجانسة - الصور، واستقبال الحس العميق، وتعليمات اللغة، وتاريخ الإجراء - من خلال نموذج تسلسل موحد. تشتمل البنى الأساسية على RT-1 (الإجراءات الرمزية مع رؤية EfficientNet)، وRT-2 (العمود الفقري VLM)، وACT (محول تقطيع الحركة للتحكم اليدوي)، وOcto (محول التجسيد المتقاطع القابل للتطوير). تتعامل المحولات بشكل طبيعي مع السياقات ذات الطول المتغير والتكييف متعدد المهام. التحدي الرئيسي الذي يواجهونه في مجال الروبوتات هو زمن الوصول الاستدلالي، حيث يتطلب التحكم في الوقت الفعلي عند تردد 10–50 هرتز تصميمات نموذجية فعالة أو تقطيع الإجراء لاستهلاك الحوسبة.
لماذا يهم فرق الروبوت
يعد فهم سياسة المحولات أمرًا ضروريًا للفرق التي تقوم ببناء أنظمة الروبوتات في العالم الحقيقي. سواء كنت تقوم بجمع بيانات العرض التوضيحي، أو سياسات التدريب في المحاكاة، أو النشر في الإنتاج، فإن هذا المفهوم يؤثر بشكل مباشر على سير العمل وتصميم النظام لديك.