मोबाइल अलोहा सेटअप गाइड: हार्डवेयर, सॉफ्टवेयर और पहला डेमो

मोबाइल ALOHA अकादमिक अनुसंधान से उभरने वाले सबसे प्रभावशाली द्वि-मैन्युअल हेरफेर प्लेटफार्मों में से एक है। इसे एंड-टू-एंड चलाना - हार्डवेयर असेंबल करना, आर्म्स कैलिब्रेटेड, सॉफ्टवेयर स्टैक लाइव, और पहला प्रदर्शन रिकॉर्ड करना - सिस्टम की प्रत्येक परत पर सावधानीपूर्वक ध्यान देना आवश्यक है।

हार्डवेयर असेंबली अवलोकन

एक मोबाइल ALOHA सिस्टम में एक पहिएदार मोबाइल बेस (आमतौर पर एक AgileX ट्रेसर या समकक्ष डिफरेंशियल-ड्राइव प्लेटफ़ॉर्म) होता है, जिसमें दो ViperX 300 या समान 6-DOF हथियार एक उभरे हुए चेसिस पर लगे होते हैं। द्वि-मैनुअल सेटअप के लिए लीडर और फॉलोअर आर्म्स के मिलान जोड़े की आवश्यकता होती है: लीडर आर्म्स हल्के होते हैं, पीछे से चलाए जा सकते हैं, और टेलीऑपरेशन के दौरान मानव ऑपरेटर द्वारा पकड़े जाते हैं; अनुयायी भुजाएँ रोबोट भुजाएँ हैं जो वास्तविक समय में नेता की गतिविधियों को प्रतिबिंबित करती हैं।

लीडर आर्म एर्गोनॉमिक्स से मेल खाने के लिए फॉलोअर आर्म्स को चेसिस पर सही ऊंचाई और लेटरल ऑफसेट पर माउंट करने के साथ असेंबली शुरू होती है। नेता और अनुयायी की ज्यामिति के बीच बेमेल नियंत्रण गुणवत्ता संबंधी समस्याओं का एक सामान्य स्रोत है। कैमरा स्टैक - आम तौर पर प्रत्येक अनुयायी बांह पर एक कलाई पर लगाया जाने वाला कैमरा और एक या दो ओवरहेड कैमरे - किसी भी सॉफ़्टवेयर अंशांकन शुरू होने से पहले स्थापित और सुरक्षित किए जाने चाहिए। केबल प्रबंधन जितना दिखता है उससे कहीं अधिक मायने रखता है: ढीले केबल एपिसोड को बाधित करते हैं और खराब डेटा उत्पन्न करते हैं।

नेता-अनुयायी अंशांकन

कैलिब्रेशन वह कदम है जिसमें अधिकांश टीमें जल्दबाजी करती हैं और अधिकांश टीमें पछताती हैं। किसी एकल एपिसोड को रिकॉर्ड करने से पहले लीडर और अनुयायी की भुजाएं संयुक्त-शून्य स्थिति में होनी चाहिए। अधिकांश वाइपरएक्स-आधारित सेटअप भौतिक अंशांकन फिक्स्चर के साथ आते हैं - उनका उपयोग करें। मैकेनिकल जीरो-आईएनजी के बाद, सॉफ्टवेयर कैलिब्रेशन शून्य मुद्रा में लीडर और अनुयायी के बीच संयुक्त ऑफसेट को कैप्चर करता है और इसे टेलीऑपरेशन के दौरान वास्तविक समय में लागू पूर्वाग्रह सुधार के रूप में संग्रहीत करता है।

लीडर आर्म्स को उनके कार्यक्षेत्र के माध्यम से धीरे-धीरे कमांड देकर और फॉलोअर आर्म्स ट्रैक को देखकर अंशांकन गुणवत्ता का परीक्षण करें। कोई भी लगातार संयुक्त-स्थान अंतराल, विशिष्ट संयुक्त कोणों पर बहाव, या बाएं और दाएं के बीच असममित प्रतिक्रिया एक अंशांकन त्रुटि को इंगित करती है जो आपके डेटासेट को खराब कर देगी। किसी भी डेटा संग्रह अभियान को शुरू करने से पहले पुन: अंशांकन करें, और सिस्टम को शिपिंग करने या यांत्रिक समायोजन करने के बाद अंशांकन को पुन: सत्यापित करें।

सॉफ़्टवेयर स्टैक: ACT और LeRobot

मूल मोबाइल ALOHA पेपर ने प्रदर्शन डेटा पर प्रशिक्षित ACT (एक्शन चंकिंग विद ट्रांसफॉर्मर्स) नीति का उपयोग किया। सॉफ़्टवेयर स्टैक में तीन परतें शामिल हैं: रोबोट के एम्बेडेड कंप्यूट पर चलने वाली एक निम्न-स्तरीय नियंत्रण परत, एक टेलीऑपरेशन रिकॉर्डिंग परत जो संयुक्त स्थिति और कैमरा फ्रेम को समकालिक रूप से कैप्चर करती है, और एक प्रशिक्षण परत जहां एकत्रित डेटासेट पर ACT या किसी अन्य नीति को प्रशिक्षित किया जाता है।

हगिंग फेस से लेरोबोट इस वर्कफ़्लो के लिए मानक ओपन-सोर्स फ्रेमवर्क बन गया है। यह एक एकीकृत डेटा प्रारूप, ALOHA-शैली हार्डवेयर के लिए रिकॉर्डिंग स्क्रिप्ट और ACT, डिफ्यूजन पॉलिसी और TDMPC के लिए प्रशिक्षण पाइपलाइन प्रदान करता है। एसवीआरसी का डेटा प्लेटफ़ॉर्म लेरोबोट-संगत प्रारूप में डेटासेट निर्यात करता है, जिससे एसवीआरसी-एकत्रित डेटा पर प्रशिक्षण या भंडारण और संस्करण के लिए अपने स्वयं के प्रदर्शन अपलोड करना आसान हो जाता है।

आपका पहला डेटा संग्रह सत्र रिकॉर्ड करना

रिकॉर्डिंग से पहले, कार्य को सटीक रूप से परिभाषित करें। "कप उठाओ" बहुत अस्पष्ट है - कप का प्रारंभिक स्थान, अभिविन्यास और लक्ष्य स्थान निर्दिष्ट करें। कार्य सेटअप में निरंतरता ही प्रदर्शन डेटासेट को सीखने योग्य बनाती है। एपिसोड के बीच कार्यस्थल को शुरुआती स्थिति में तुरंत वापस लाने के लिए 3-5 रीसेट प्रक्रियाएं तैयार करें।

पहले सत्र के लिए, एकल, साफ़-सुथरे परिभाषित कार्य के 50 सफल प्रदर्शनों का लक्ष्य रखें। 30 हर्ट्ज़ या इससे अधिक पर रिकॉर्ड करें। रिकॉर्डिंग के तुरंत बाद प्रत्येक एपिसोड को सफलता ध्वज के साथ एनोटेट करें - एनोटेशन को बाद के लिए न छोड़ें। एसवीआरसी शुरू से ही विविधता लाने के लिए कम से कम दो अलग-अलग प्रकाश स्थितियों में और ऑब्जेक्ट प्लेसमेंट में मामूली बदलाव के साथ रिकॉर्डिंग की सिफारिश करता है। एसवीआरसी डेटा सेवा मंच इस वर्कफ़्लो को सुव्यवस्थित करने के लिए एपिसोड ब्राउज़र और एनोटेशन टूल प्रदान करता है।

सामान्य मुद्दे और उन्हें कैसे ठीक करें

नए मोबाइल ALOHA सेटअप के साथ सबसे आम समस्याएं चार श्रेणियों में आती हैं। सबसे पहले, लीडर-फ़ॉलोअर अंतराल: आमतौर पर नियंत्रण लूप पर नेटवर्क विलंबता के कारण होता है - सुनिश्चित करें कि लीडर और फ़ॉलोअर एक ही स्थानीय मशीन पर हैं या एक समर्पित ईथरनेट लिंक के माध्यम से जुड़े हुए हैं, वाईफाई से नहीं। दूसरा, कैमरा सिंक्रोनाइज़ेशन बहाव: यदि कलाई और ओवरहेड कैमरे हार्डवेयर-सिंक नहीं हैं, तो फ़्रेम इंडेक्स संरेखण के बजाय डेटा लोडिंग के दौरान टाइमस्टैम्प-आधारित संरेखण का उपयोग करें। तीसरा, द्वि-मैन्युअल कार्यों के दौरान हाथ की टक्कर: गहन प्रशिक्षण से पहले यूआरडीएफ में नरम संयुक्त सीमाएं और टक्कर जाल जोड़ें। चौथा, बेस मोशन हाथ के प्रदर्शन में हस्तक्षेप करता है: केवल हेरफेर डेटा एकत्र करते समय, बहाव को रोकने के लिए बेस लॉक संलग्न करें।

आपके पहले डेमो के बाद अगले चरण

एक बार जब आपके पास एक साफ़ 50-एपिसोड डेटासेट हो, तो ACT नीति को प्रशिक्षित करने के लिए LeRobot प्रशिक्षण पाइपलाइन का उपयोग करें। स्वच्छ डेटा के साथ एक अच्छी तरह से परिभाषित कार्य पर पहले प्रयास की सफलता दर 40-60% की अपेक्षा करें - यह सामान्य है और अधिक प्रदर्शनों और डेटा विविधता के साथ तेजी से सुधार होता है। जैसे ही आप स्केल करते हैं, एसवीआरसी डेटा संग्रह सेवाएँ मानकीकृत हार्डवेयर का उपयोग करके पेशेवर रूप से एकत्रित एपिसोड के साथ आपके डेटासेट को बढ़ा सकता है। हार्डवेयर सोर्सिंग के लिए या द्वि-मैन्युअल सिस्टम को पट्टे पर लेने के लिए, हमारी वेबसाइट पर जाएँ हार्डवेयर कैटलॉग या एसवीआरसी टीम से संपर्क करें.

संबंधित: अधिनियम नीति की व्याख्या · लेरोबोट गाइड · रोबोट डेटा एनोटेशन · डेटा सेवाएँ