منصات الروبوت

روبوت ألوها: ما هو، كيف يعمل، وكيف تبدأ

ALOHA هي منصة التشغيل عن بعد ثنائية اليدين من جامعة ستانفورد والتي أظهرت، لأول مرة، أن الروبوت يمكنه تعلم مهام التلاعب باليدين - مثل فتح كيس من رقائق البطاطس، أو ربط الكابل، أو الطهي - من عدد صغير من العروض البشرية. وهي الآن منصة البحث الثنائية الأكثر مرجعية على نطاق واسع في العالم. يشرح هذا الدليل ما هو ALOHA، وكيف يعمل، وكيفية البدء في استخدامه.

قصة أصل ستانفورد

ALOHA - نظام أجهزة مفتوح المصدر منخفض التكلفة للتشغيل عن بعد ثنائي اليدين - تم تطويره في مختبر المعالجة المتنقلة بجامعة ستانفورد وتم نشره في ورقة بحثية بعنوان "تعلم المعالجة اليدوية ثنائية الحبيبات باستخدام أجهزة منخفضة التكلفة" بقلم توني ز. تشاو وآخرون. في عام 2023. كانت الأطروحة المركزية استفزازية: لا تحتاج إلى أجهزة روبوتية باهظة الثمن ومملوكة لها لأداء تلاعب حاذق مثير للإعجاب. استخدمت ALOHA أربعة أذرع روبوتية ViperX 300 وWidowX 250 (اثنان لكل جانب، واحد كقائد للعمليات عن بعد وواحد كتابع) بتكلفة إجمالية تقل عن 20000 دولار، بالإضافة إلى خوارزمية ACT، لأداء المهام التي كانت تتطلب في السابق أنظمة مصممة حسب الطلب تكلف عدة مرات أكثر.

أظهرت الورقة 10 مهام تتم باليد، بما في ذلك فك قطعة من الحلوى، وإدخال بطارية في فتحة، وتمرير حبل عبر ثقب - كل ذلك بمعدلات نجاح تزيد عن 80% باستخدام 50 عرضًا توضيحيًا. صدمت هذه النتائج مجتمع الروبوتات ليس لأن المهام كانت جديدة، ولكن بسبب التكلفة وكفاءة البيانات. أنشأ ALOHA وACT معًا معيارًا جديدًا لأبحاث التلاعب الحاذق التي يمكن الوصول إليها وأثار موجة من أعمال المتابعة التي تستمر حتى اليوم.

تصميم أجهزة ALOHA وجميع البرامج مفتوحة المصدر بالكامل. تتوفر قائمة المواد وتعليمات التجميع وكود تدريب ACT للجمهور على GitHub. هذا الانفتاح جعل من ALOHA منصة بحثية قياسية ثنائية الاستخدام، حيث تقوم العشرات من مجموعات البحث في جميع أنحاء العالم بتشغيل إصدارات مختلفة من التصميم الأصلي. يدعم SVRC الأنظمة الأساسية من فئة ALOHA من خلال موقعنا خدمات البيانات و برنامج تأجير الأجهزة.

هندسة الأجهزة: إعداد القائد والتابع ثنائي اليدين

يتكون نظام ALOHA من زوجين حركيين، واحد لكل ذراع. يحتوي كل زوج على ذراع "قائد" - ذراع خفيف الوزن وقابل للقيادة في الخلف يحمله المشغل ويحركه بيديه - وذراع "تابع" يعكس المواقف المشتركة للقائد في الوقت الفعلي. يحمل الذراع التابع المناول الفعلي (القابض أو الأداة أو المؤثر النهائي) ويتفاعل مع العالم المادي. لا يحتوي الذراع القائد على متطلبات الحمولة الصافية للمؤثر النهائي لأنه يحتاج فقط إلى أن يكون قابلاً للقيادة الخلفية ويوفر ردود فعل عزم الدوران للمشغل.

إن التكوين الثنائي - زوجان كاملان من القائد والتابع - هو ما يجعل ALOHA قادرًا بشكل فريد على القيام بمهام بارعة. الأيدي البشرية بطبيعتها ثنائية اليدين: تمسك يد واحدة بالجسم بينما تتلاعب به الأخرى، أو تتعاون كلتا اليدين لإكمال مهمة تتطلب نقطتي اتصال متزامنتين. لا يمكن للروبوتات ذات الذراع الواحدة تقريب هذه المهام إلا من خلال تركيبات أو تسلسلات معقدة؛ يمكن للروبوتات ثنائية اليدين التعامل معها مباشرة. تم تحسين عامل الشكل ALOHA، مع تثبيت كلا الذراعين على طاولة مشتركة، لمهام المعالجة على سطح الطاولة حيث يجلس المشغل أمام النظام.

استخدم إعداد الكاميرا في ورقة ALOHA الأصلية ثلاث كاميرات: واحدة علوية (منظر علوي لمساحة العمل الكاملة)، وواحدة على المعصم الأيسر، وواحدة على المعصم الأيمن. يتم استخدام الكاميرات الثلاث كملاحظات مرئية لسياسة ACT. يُعد إعداد العرض المتعدد هذا أمرًا بالغ الأهمية: حيث توفر كاميرات المعصم مناظر قريبة لأحداث الإمساك والاتصال، بينما توفر الكاميرا العلوية سياقًا عالميًا للتنسيق بين اليدين. تُظهِر متغيرات ALOHA ذات الكاميرا الواحدة أداءً أقل بشكل ملحوظ في السياسة في المهام التي تتطلب تنسيقًا كبيرًا.

الفعل: الخوارزمية وراء الوها

تم تطوير ACT (تقطيع الحركة باستخدام المحولات) جنبًا إلى جنب مع ALOHA وهي خوارزمية التعلم الأساسية للمنصة. إن ACT عبارة عن سياسة تعلم تقليد قائمة على المحولات تتنبأ بمجموعة كبيرة من المواقف المشتركة المستقبلية - عادةً 100 خطوة زمنية عند 50 هرتز، وتغطي ثانيتين من الحركة - بدلاً من إجراء تالٍ واحد. تعمل بنية تقطيع الإجراء هذه بشكل كبير على تقليل مشكلة الخطأ المضاعف للاستنساخ السلوكي الساذج، حيث تتراكم أخطاء التنبؤ الصغيرة في كل خطوة زمنية إلى انحرافات كبيرة في المسار على مدار المهمة.

تستخدم بنية سياسة ACT برنامج تشفير CVAE (جهاز التشفير التلقائي المتغير المشروط) أثناء التدريب لالتقاط النمط الكامن لكل عرض توضيحي - بشكل أساسي، تمثيل مضغوط لـ "كيف" أكمل الإنسان المهمة، يختلف عن "ما" كانت نتيجة المهمة. وهذا يمكّن السياسة من نمذجة التباين الطبيعي في المظاهرات البشرية دون آثار متوسط الوضع. في وقت الاستدلال، يتم تشغيل وحدة فك ترميز CVAE فقط، بشرط المراقبة الحالية والمتجه الكامن الذي تم أخذ عينات منه، لإنشاء مقطع الإجراء.

يستغرق تدريب ACT على مجموعة بيانات ALOHA مع 50 عرضًا توضيحيًا لكل مهمة من 2 إلى 4 ساعات على وحدة معالجة الرسومات RTX 3090 واحدة. يعد كود التدريب، الذي تم إصداره مع الورقة الأصلية، سهل التشغيل باستخدام المعلمات الفائقة الموثقة لمهام ALOHA القياسية. بالنسبة للمهام المخصصة، فإن المعلمة الفائقة الأكثر تأثيرًا التي يجب ضبطها هي حجم القطعة (kl_weight في التكوين) - تعمل القطع الأكبر على تحسين الاتساق الزمني على حساب التفاعل مع الاضطرابات غير المتوقعة. SVRC منصة يتضمن مسارات تدريب ACT التي تم تكوينها مسبقًا لمجموعات البيانات بتنسيق ALOHA.

Mobile ALOHA: إخراج ALOHA من على الطاولة

قام Mobile ALOHA، الذي نشرته نفس مجموعة ستانفورد في عام 2024، بتوسيع مفهوم ALOHA ليشمل قاعدة متنقلة. تم تركيب إعداد الذراع ثنائي اليد على قاعدة متنقلة AgileX Tracer، مما يمكّن النظام من التنقل إلى مواقع مختلفة داخل المساحة - الاقتراب من طاولة المطبخ، والانتقال إلى طاولة الطعام، والتنقل في الردهة - مع الاحتفاظ بأذرع ALOHA للتلاعب. أظهر برنامج Mobile ALOHA مهامًا مثل طهي الجمبري على الموقد، وتحميل غسالة الأطباق، وتسليم الطرود، وهي مهام تتطلب الحركة والتلاعب ببراعة.

قدم Mobile ALOHA مفهوم التشغيل عن بعد لكامل الجسم: يتحكم المشغل في كل من القاعدة المتنقلة والذراعين في وقت واحد، إما من خلال واجهات تحكم منفصلة أو من خلال واجهة موحدة تحدد حركات جسم المشغل وفقًا لتكوين جسم الروبوت بالكامل. يعد جمع البيانات لـ Mobile ALOHA أكثر تعقيدًا بكثير من ALOHA المنضدية لأن السياسة يجب أن تتعلم تنسيق التنقل والمعالجة، مما يتطلب عروضًا توضيحية تغطي الاختلاف المكاني في البيئة بالإضافة إلى اختلاف الكائنات.

قدمت Mobile ALOHA أيضًا تدريبًا مشتركًا: تدريب سياسة Mobile ALOHA بشكل مشترك على عروض التلاعب بالأجهزة المحمولة وعروض التلاعب الثابتة بـ ALOHA. أدى التدريب المشترك إلى تحسين أداء المعالجة على منصة الهاتف المحمول، مما يشير إلى أن معرفة المعالجة اليدوية من بيانات الطاولة تنتقل بشكل مفيد إلى سياق الهاتف المحمول. يقدم SVRC مجموعات بيانات متوافقة مع Mobile ALOHA ويمكنه جمع عروض توضيحية للتلاعب بالأجهزة المحمولة في منشأتنا بالو ألتو. اتصل بنا لمناقشة متطلبات بيانات Mobile ALOHA الخاصة بك.

الاختلافات بين ألوها، ألوها 2، والمشتقات التجارية

تم تحسين ALOHA 2، التي تم نشرها في أواخر عام 2024، على النسخة الأصلية بعدة أبعاد: أذرع عالية الجودة مع إمكانية تكرار أفضل، ونظام تركيب كاميرا محسّن، وتصميم معصم منقح يقلل من تعقيد توجيه الكابل. كما تم تحديث النظام الكهربائي لاستخدام لوحة توزيع الطاقة المخصصة بدلاً من كابلات الطاقة المتسلسلة، مما يحسن الموثوقية أثناء جلسات جمع البيانات الطويلة. يحافظ ALOHA 2 على التوافق الكامل للبرامج مع النسخة الأصلية - يمكن لمجموعات البيانات التي تم جمعها في أحدهما تدريب السياسات التي تم تقييمها على الآخر، مع مراعاة التحذيرات المعتادة حول اختلاف الأجهزة.

يبيع العديد من البائعين التجاريين الآن منصات متوافقة مع ALOHA - أنظمة تم تجميعها مسبقًا واختبارها وتتبع المواصفات الميكانيكية والبرمجية لـ ALOHA دون مطالبة المنشئ بمصدر المكونات وتجميع الأذرع بأنفسهم. تكلف أنظمة ALOHA التجارية هذه أكثر من فاتورة المواد التي يتم تصنيعها بنفسك ولكنها تقلل بشكل كبير من وقت الإعداد وخطر أخطاء التجميع. يتضمن كتالوج أجهزة SVRC تكوينات متوافقة مع ALOHA؛ انظر محل للخيارات الحالية والتسعير.

البدء مع ALOHA من خلال SVRC

يدعم SVRC الأبحاث المستندة إلى ALOHA في كل مرحلة. بالنسبة للفرق التي بدأت للتو، فإننا نقدم خدمة تأجير منصة ALOHA من خلال موقعنا برنامج تأجير الروبوت - الوصول إلى إعداد يدوي كامل مقابل رسوم شهرية ثابتة دون الالتزام برأس المال لشراء الأجهزة. تصل الأنظمة المستأجرة تمت معايرتها مسبقًا وتكون جاهزة لجمع العروض التوضيحية في اليوم الأول.

لجمع البيانات، لدينا الخدمة المدارة يوفر مشغلي ALOHA المدربين الذين يمكنهم جمع العروض التوضيحية في منشأة Palo Alto الخاصة بنا، مع مجموعات البيانات المقدمة بتنسيق RLDS/LeRobot المتوافق مع ACT وDiffusion Policy وخطوط تدريب OpenVLA. يتمتع العاملون لدينا بالخبرة في مهام التنسيق اليدوية ويتبعون بروتوكولات الجودة المنظمة التي تنتج مجموعات بيانات أنظف مما يحققه الباحثون لأول مرة عادةً. يمكننا أيضًا زيارة موقعك لحملات جمع البيانات في الموقع إذا كانت مهمتك تتطلب ذلك.

للتدريب على السياسات وتقييمها، منصة SVRC يوفر مسارات تدريب ACT التي تم تكوينها مسبقًا وتتبع التجارب وأدوات التقييم لسياسات ALOHA. ملكنا المعايير قم بتضمين تقييمات المهام الخاصة بـ ALOHA والتي تتيح لك مقارنة أداء سياستك مع عمليات التنفيذ المرجعية. سواء كنت تقوم ببناء برنامج بحثي للتلاعب باليدين من الصفر أو تحاول تحسين أداء نظام موجود، فريق SVRC يمكن أن تساعدك على التخطيط للنهج الصحيح.