المفاهيم

شرح الذكاء الاصطناعي المادي: ما هو ولماذا يختلف عن الذكاء الاصطناعي البرمجي

يختلف الذكاء الاصطناعي المادي – الذكاء الاصطناعي الذي يعمل في العالم المادي وفيه من خلال الروبوتات والأنظمة المتجسدة الأخرى – عن الذكاء الاصطناعي البرمجي بطرق مهمة للغاية بالنسبة لكيفية بنائه، وما هي البيانات التي يتطلبها، وما يمكنه تحقيقه في النهاية. يعد فهم هذا التمييز أمرًا ضروريًا لأي شخص يقوم ببناء أو نشر أنظمة روبوتية في عام 2026.

تعريف الذكاء الاصطناعي المادي

يشير الذكاء الاصطناعي المادي إلى أنظمة الذكاء الاصطناعي التي تدرك العالم المادي من خلال أجهزة الاستشعار وتتصرف عليه من خلال المحركات - المحركات، وأنظمة الهواء المضغوط، والمؤثرات النهائية - بدلاً من توليد النصوص أو الصور أو التعليمات البرمجية. يؤكد "المادي" في الذكاء الاصطناعي المادي على الاختلاف عن الذكاء الاصطناعي الرقمي البحت: يقوم نموذج اللغة بمعالجة وإنتاج الرموز المميزة؛ يقوم نظام الذكاء الاصطناعي المادي بمعالجة قراءات المستشعرات وينتج أوامر حركية تحرك الكتلة عبر الفضاء وتتفاعل مع الأشياء.

تم نشر هذا المصطلح من قبل Jensen Huang من NVIDIA لوصف العصر القادم لأنظمة الذكاء الاصطناعي للروبوتات والآلات المستقلة، وقد اكتسب اعتمادًا واسع النطاق في الصناعة. إنه في الأساس مرادف لـ "الذكاء الاصطناعي المتجسد" - المصطلح الأكاديمي الأقدم - ولكن مع تركيز أقوى على النشر في المنتجات المادية والأنظمة الصناعية بدلاً من الاقتصار على البحث.

لماذا يغير التجسيد كل شيء

يمكن تدريب برامج الذكاء الاصطناعي بشكل كامل على البيانات الموجودة بالفعل، مثل النصوص المستخرجة من الإنترنت والصور ومقاطع الفيديو. يتطلب الذكاء الاصطناعي المادي التفاعل مع العالم لتوليد بيانات التدريب الخاصة به. يمكن لنموذج اللغة أن يتعلم من الكتابة البشرية التي تم إنتاجها على مدى قرون؛ يجب على الروبوت إنشاء العروض التوضيحية الخاصة به من خلال التشغيل الجسدي عن بعد أو الاستكشاف المستقل، حلقة واحدة في كل مرة، في الوقت الفعلي. هذا هو عنق الزجاجة الأساسي للبيانات في الذكاء الاصطناعي المادي.

يقدم التجسيد أيضًا عواقب. عندما يرتكب نموذج اللغة خطأً، فإنه ينتج نصًا غير صحيح. عندما يرتكب الروبوت خطأ ما، فإنه يمكن أن يلحق الضرر بالأشياء، أو يصيب الأشخاص، أو يدمر نفسه. يغير هيكل العواقب هذا متطلبات الموثوقية والقياس الكمي لعدم اليقين وأنماط الفشل الآمنة بطرق لا يواجهها الذكاء الاصطناعي البرمجي. إن نظام الذكاء الاصطناعي المادي الذي يمكن الاعتماد عليه بنسبة 95% قد يكون مقبولاً تجارياً في بعض البيئات وخطيراً بشكل كارثي في أماكن أخرى، اعتماداً على مخاطر الفشل بنسبة 5%.

مشكلة البيانات

التحدي الأبرز الذي يواجهه الذكاء الاصطناعي المادي هو ندرة البيانات. يحتوي الإنترنت على مئات التريليونات من الرموز النصية ومليارات الصور، مما يوفر ركيزة هائلة لتدريب نماذج اللغة والرؤية. لا توجد مجموعة مكافئة من بيانات تفاعل الروبوت. تحتوي مجموعة بيانات Open X-Embodiment، وهي أكبر مجموعة بيانات روبوت مفتوحة اعتبارًا من عام 2026، على ما يقرب من مليون حلقة روبوت - وهي بيانات أقل حجمًا من استخدامات التدريب المسبق لـ LLM.

إن سد هذه الفجوة هو المهمة المركزية لمنظمات مثل SVRC. ملكنا منصة خدمات البيانات يوجد لمساعدة فرق البحث وشركات الذكاء الاصطناعي على جمع بيانات توضيحية عالية الجودة للروبوت على نطاق واسع. يجب جمع البيانات الخاصة بالذكاء الاصطناعي المادي على أجهزة حقيقية، في بيئات حقيقية، بواسطة مشغلين بشريين ماهرين أو من خلال خطوط تجميع مستقلة مصممة بعناية - ولا يمكن استخراجها من الويب. ولهذا السبب تعتبر البنية التحتية لجمع البيانات ذات أهمية استراتيجية للذكاء الاصطناعي المادي مثل البنية التحتية الحاسوبية للذكاء الاصطناعي البرمجي.

نماذج الأساس للعالم المادي

يعمل مجال الذكاء الاصطناعي بشكل نشط على بناء نماذج أساسية للذكاء الاصطناعي المادي والتي توازي GPT-4 وGemini للغة والصور. يتم تدريب هذه النماذج - التي تسمى أحيانًا النماذج الأساسية للروبوت، أو النماذج العالمية، أو سياسات الروبوت العامة - على مجموعات بيانات كبيرة للتجسيد المتقاطع، ويمكن ضبطها بدقة على روبوتات ومهام محددة مع عدد قليل نسبيًا من العروض التوضيحية الإضافية. تشمل الأمثلة Octo (من جامعة كاليفورنيا في بيركلي)، OpenVLA، π0 (من الذكاء الفيزيائي)، وRT-2 وRT-2-X من Google.

تمثل هذه النماذج نقلة نوعية حقيقية: فبدلاً من تدريب سياسة جديدة من الصفر لكل مهمة، يمكن للفرق البدء من نموذج أساسي مدرب مسبقًا يفهم بالفعل كيفية التعامل مع الكائنات واتباع التعليمات، ثم ضبطه ليناسب الروبوت الخاص بهم ومجال المهمة. تحدد جودة وتغطية مجموعة بيانات ما قبل التدريب بشكل مباشر مدى فائدة النموذج الأساسي، ولهذا السبب يعد جمع البيانات على نطاق واسع أولوية استراتيجية للمجال بأكمله.

المجموعات البحثية الرائدة والجهات الفاعلة في الصناعة

يشمل القادة الأكاديميون في أبحاث الذكاء الاصطناعي الفيزيائي جامعة كاليفورنيا في بيركلي (مجموعات تشيلسي فين، وبيتر أبيل، وكين غولدبرغ)، وستانفورد (في-في لي، ودورسا صادق، ومختبرات تشيلسي فين)، وجامعة كارنيجي ميلون (ديباك باثاك، وديفيد هيلد)، ومعهد ماساتشوستس للتكنولوجيا (بولكيت أغراوال، وروس تيدريك)، وETH زيوريخ (مجموعة الروبوتات ذات الأرجل لماركو هوتر). يشمل قادة الصناعة الذكاء الفيزيائي (π)، وGoogle DeepMind Robotics، وNVIDIA Isaac Lab، وMicrosoft Research Robotics، وأقسام الروبوتات في شركات الروبوتات الكبرى.

دور SVRC في الذكاء الاصطناعي المادي

يحتل SVRC طبقة بنية تحتية مهمة في النظام البيئي للذكاء الاصطناعي المادي: نحن نقدم خدمات الأجهزة وجمع البيانات التي تمكن من بحث ونشر الذكاء الاصطناعي المادي. تم تصميم منشأة بالو ألتو وبرنامج تأجير الروبوتات ومنصة البيانات لجعل تطوير الذكاء الاصطناعي المادي في متناول الفرق التي لا تملك الموارد اللازمة لبناء أسطول الأجهزة الخاص بها والبنية التحتية للتجميع. سواء كنت معمل أبحاث يدرب سياسة جديدة، أو شركة ناشئة تبني منتجًا ماديًا، أو مؤسسة تدير طيارًا آليًا، فإن SVRC يوفر طبقة البنية التحتية المادية التي يتطلبها الذكاء الاصطناعي المادي. ابدأ معنا خدمات البيانات أو تأجير الروبوت البرنامج، أو اتصل بنا لمناقشة مشروع الذكاء الاصطناعي الفيزيائي المحدد الخاص بك.