रोबोट सीखना

ओपन एक्स-अवतार: यह क्या है और रोबोट सीखने के लिए यह क्यों मायने रखता है

ओपन एक्स-एम्बोडिमेंट (ओएक्सई) अस्तित्व में सबसे बड़ा ओपन सहयोगी रोबोट लर्निंग डेटासेट है। 30 से अधिक अनुसंधान संस्थानों के एक संघ द्वारा जारी, यह सामान्यवादी रोबोट नीतियों के लिए एक फाउंडेशन डेटासेट बनाने के पहले गंभीर प्रयास का प्रतिनिधित्व करता है - इमेजनेट या द पाइल के समकक्ष रोबोटिक्स।

ओपन एक्स-अवतार क्या है?

ओपन एक्स-एम्बोडिमेंट 22 से अधिक विभिन्न रोबोट अवतारों में एकत्र किए गए रोबोट हेरफेर प्रदर्शनों का एक एकीकृत डेटासेट है - जिसमें फ्रैंका, विडोएक्स, यूआर 5, कूका और अन्य के हथियार शामिल हैं - और दुनिया भर में दर्जनों अनुसंधान प्रयोगशालाओं में। डेटासेट में कुल दस लाख से अधिक एपिसोड हैं, जिनमें सैकड़ों अलग-अलग हेरफेर कार्य शामिल हैं: चुनना, रखना, दराज खोलना, तरल पदार्थ डालना, सतहों को पोंछना और बहुत कुछ।

नाम में "X" क्रॉस-अवतार के लिए है: OXE की परिभाषित महत्वाकांक्षा उन नीतियों को प्रशिक्षित करना है जो रोबोट निकायों में ज्ञान स्थानांतरित करती हैं। पूर्ण OXE डेटासेट पर पूर्व-प्रशिक्षित नीति में आर्म ज्यामिति, ग्रिपर प्रकार, कैमरा कॉन्फ़िगरेशन और कार्य डोमेन की एक विस्तृत श्रृंखला से हेरफेर व्यवहार देखा गया है, जिससे इसे एक समृद्ध पूर्व प्रदान किया जा सकता है जिसे स्क्रैच से प्रशिक्षण की तुलना में बहुत कम प्रदर्शनों के साथ एक नए रोबोट में ठीक किया जा सकता है।

भाग लेने वाले संस्थान और डेटासेट संरचना

योगदान देने वाले संस्थानों में स्टैनफोर्ड, यूसी बर्कले, गूगल डीपमाइंड, कार्नेगी मेलॉन, एमआईटी, ईटीएच ज्यूरिख और कई अन्य शामिल हैं। प्रत्येक प्रयोगशाला ने अपने मौजूदा प्रदर्शन डेटासेट को एक मानकीकृत प्रारूप में योगदान दिया। डेटासेट Google क्लाउड स्टोरेज पर होस्ट किया गया है और अनुसंधान उपयोग के लिए स्वतंत्र रूप से उपलब्ध है। उप-डेटासेट आकार में काफी भिन्न होते हैं: कुछ प्रयोगशालाओं ने हजारों एपिसोड का योगदान दिया, अन्य ने कुछ सौ। कार्य वितरण टेबलटॉप पिक-एंड-प्लेस की ओर झुका हुआ है, जो सबसे सामान्य प्रयोगात्मक सेटअप को दर्शाता है, लेकिन वस्तुओं, प्रकाश की स्थिति और आर्म कॉन्फ़िगरेशन की विविधता वास्तव में व्यापक है।

Google के रोबोटिक्स ट्रांसफॉर्मर 2 (RT-2) और उसके बाद के मॉडलों को OXE डेटा पर प्रशिक्षित किया गया और प्रदर्शित किया गया कि क्रॉस-अवतार पूर्व-प्रशिक्षण एकल-रोबोट प्रशिक्षण की तुलना में सार्थक रूप से बेहतर शून्य-शॉट सामान्यीकरण के साथ नीतियां तैयार करता है। इस परिणाम ने मूल ओएक्सई परिकल्पना को मान्य किया और पूरे क्षेत्र में क्रॉस-अवतार डेटासेट को अपनाने में तेजी लाई।

डेटासेट प्रारूप और आरएलडीएस

ओएक्सई आरएलडीएस (रोबोट लर्निंग डेटासेट स्पेसिफिकेशन) प्रारूप का उपयोग करता है, जो रोबोट प्रक्षेपवक्र को संग्रहीत करने के लिए एक टेन्सरफ्लो डेटासेट-आधारित स्कीमा है। आरएलडीएस में प्रत्येक एपिसोड चरणों का एक क्रम है, जहां प्रत्येक चरण में एक अवलोकन शब्दकोश (छवियां, संयुक्त राज्य, ग्रिपर राज्य), एक एक्शन वेक्टर, एक इनाम सिग्नल और कार्य का वर्णन करने वाला एक भाषा एनोटेशन होता है। स्कीमा विभिन्न अवलोकन तौर-तरीकों और विभिन्न अवतारों में कार्य स्थानों को समायोजित करने के लिए पर्याप्त लचीली है।

RLDS के साथ कार्य करने के लिए TensorFlow या rlds_creator लाइब्रेरी की आवश्यकता होती है। हगिंग फेस का लेरोबोट OXE डेटा को अपने प्रारूप में बदलने के लिए रूपांतरण उपयोगिताएँ प्रदान करता है, जिससे यह उन शोधकर्ताओं के लिए सुलभ हो जाता है जो PyTorch को पसंद करते हैं। एसवीआरसी का डेटा प्लेटफ़ॉर्म आरएलडीएस और लेरोबोट दोनों के साथ संगत प्रारूप में डेटासेट निर्यात करता है, जिससे भविष्य में ओएक्सई रिलीज में सीधा योगदान संभव हो जाता है।

OXE में योगदान कैसे करें

OXE में अपने डेटासेट का योगदान करने के लिए RLDS में अपने प्रदर्शनों को फ़ॉर्मेट करना, प्रति-चरण भाषा एनोटेशन जोड़ना और अपने डेटासेट दस्तावेज़ के साथ OXE GitHub रिपॉजिटरी में एक पुल अनुरोध सबमिट करना आवश्यक है। सबमिशन प्रक्रिया में डेटा गुणवत्ता और प्रारूप अनुपालन की समीक्षा शामिल है। यदि आपके प्रदर्शन एसवीआरसी डेटा सेवाओं के साथ एकत्र किए गए थे, तो प्लेटफ़ॉर्म मानकीकृत मेटाडेटा के साथ आरएलडीएस-संगत निर्यात उत्पन्न कर सकता है, जिससे योगदान प्रक्रिया काफी सरल हो जाएगी। संपर्क एसवीआरसी टीम ओएक्सई सबमिशन के लिए अपना डेटा तैयार करने पर मार्गदर्शन के लिए।

पूर्व-प्रशिक्षण के लिए OXE का उपयोग करना

OXE का सबसे व्यावहारिक रूप से मूल्यवान उपयोग पूर्व-प्रशिक्षण डेटासेट के रूप में है। अपने कार्य डोमेन और रोबोट के लिए प्रासंगिक OXE का एक उपसमूह डाउनलोड करें, एक सामान्य नीति रीढ़ को प्रशिक्षित करें, फिर अपने स्वयं के कार्य-विशिष्ट प्रदर्शनों को बेहतर बनाएं। उच्च अंतिम प्रदर्शन प्राप्त करते समय इस दृष्टिकोण को लगातार शुरुआत से प्रशिक्षण की तुलना में कम कार्य-विशिष्ट प्रदर्शनों की आवश्यकता होती है - अक्सर 5-10x कम।

OXE पर प्री-ट्रेनिंग तब सबसे अधिक फायदेमंद होती है जब आपका फाइन-ट्यूनिंग डेटा सीमित होता है (100 एपिसोड से कम), जब आपके कार्य वैचारिक रूप से OXE में कार्यों के समान होते हैं, और जब आप ऑक्टो, ओपनवीएलए, या आरटी-2-एक्स जैसे क्रॉस-अवतार स्थानांतरण के लिए डिज़ाइन किए गए आर्किटेक्चर का उपयोग कर रहे होते हैं। जब आपके पास परिनियोजन स्थितियों में प्रचुर मात्रा में उच्च-गुणवत्ता वाले प्रदर्शन एकत्र होते हैं, तो स्क्रैच से शुद्ध कार्य-विशिष्ट फ़ाइन-ट्यूनिंग प्रतिस्पर्धी बनी रहती है।

एसवीआरसी संगतता और हम कैसे मदद करते हैं

एसवीआरसी का डेटा संग्रह मानक शुरू से ही ओएक्सई-संगत होने के लिए डिज़ाइन किया गया है: मानकीकृत कैमरा प्लेसमेंट, सुसंगत एनोटेशन स्कीमा, गुणवत्ता-गेटेड सफलता लेबलिंग, और आरएलडीएस-तैयार निर्यात। एसवीआरसी के माध्यम से डेटा एकत्र किया गया डेटा सेवाएँ ओएक्सई फाइन-ट्यूनिंग के लिए सीधे इस्तेमाल किया जा सकता है या भविष्य के डेटासेट रिलीज में योगदान दिया जा सकता है। उन टीमों के लिए जो अपने विशिष्ट हार्डवेयर पर ओएक्सई पूर्व-प्रशिक्षित मॉडल का लाभ उठाना चाहते हैं, एसवीआरसी फाइन-ट्यूनिंग पाइपलाइन स्थापित करने और तैनाती-तैयार नीतियों का मूल्यांकन करने के लिए इंजीनियरिंग सहायता प्रदान करता है।