سياسة الانتشار
تعلم السياسة الحركية عن طريق نشر تقليل الضوضاء المشروط. جامعة كولومبيا.
ملخص
تمثل سياسة الانتشار سلوك الروبوت كعملية نشر مشروطة لتقليل الضوضاء. إنه يتعامل مع توزيعات الحركة متعددة الوسائط، ومساحات الحركة عالية الأبعاد، ويظهر ثباتًا قويًا في التدريب. متوسط +46.9% تحسن مقارنة بالطرق السابقة عبر 15 مهمة معالجة.
بنيان
- تراجع السيطرة على الأفق
- التكييف البصري
- محولات انتشار السلسلة الزمنية
- آي جي آر آر 2024
الروابط الرسمية
- diffusion-policy.cs.columbia.edu - موقع المشروع
- github.com/columbia-ai-robotics/diffusion_policy - الرمز، التاريخ، العقيد
الاقتباس
IJRR 2024. راجع موقع مشروع BibTeX.