वास्तविकता का अंतर
जो नीतियाँ सिमुलेशन में 95% सफलता प्राप्त करती हैं, वास्तविक दुनिया में अक्सर 30-50% तक गिर जाती हैं। यह "वास्तविकता अंतर" दृश्य अंतर (प्रतिपादन बनाम वास्तविक छवियों), भौतिकी अंतर (संपर्क मॉडल अशुद्धियाँ), और सेंसर शोर पैटर्न से उत्पन्न होता है। इस अंतर को व्यवस्थित रूप से पाटना रोबोट सीखने में सबसे महत्वपूर्ण व्यावहारिक कौशल में से एक है।
तीन रणनीतियाँ
डोमेन रैंडमाइजेशन: व्यापक पैरामीटर वितरण में प्रशिक्षण ताकि वास्तविक दुनिया "सिर्फ एक और नमूना" हो। सिस्टम पहचान: वास्तविकता से मेल खाने के लिए सिमुलेशन मापदंडों को सावधानीपूर्वक मापें और कैलिब्रेट करें। फाइन-ट्यूनिंग: सिमुलेशन में प्रशिक्षण लें, फिर एक छोटा वास्तविक दुनिया डेटासेट (50-200 एपिसोड) एकत्र करें और फाइन-ट्यून करें। अधिकांश सफल तैनाती इन तीनों को जोड़ती है।
- डोमेन रैंडमाइजेशन: दृश्य नीतियों के लिए सर्वोत्तम
- सिस्टम पहचान: संपर्क-समृद्ध कार्यों के लिए सर्वोत्तम
- वास्तविक दुनिया की फ़ाइन-ट्यूनिंग: लगभग हमेशा प्रदर्शन में सुधार करती है
- अनुशंसित: तीनों को मिलाएं
व्यावहारिक युक्तियाँ
म्यूजोको या इसाक सिम से शुरुआत करें (दोनों के पास अच्छे संपर्क मॉडल हैं)। कैमरे की स्थिति, प्रकाश व्यवस्था और वस्तु की बनावट को आक्रामक ढंग से यादृच्छिक करें। वास्तविक जोड़ घर्षण और अवमंदन को मापें। जटिल कार्यों को करने से पहले किसी सरल कार्य को सिम-टू-रियल पर सत्यापित करें। एसवीआरसी ओपनआर्म के लिए कैलिब्रेटेड सिमुलेशन मॉडल प्रदान करता है।