लेरोबोट: ओपन-सोर्स रोबोट लर्निंग लाइब्रेरी की व्याख्या
लेरोबोट रोबोट सीखने के लिए हगिंग फेस की ओपन-सोर्स लाइब्रेरी है - सबसे व्यापक रूप से उपयोग किए जाने वाले अनुसंधान प्लेटफार्मों के लिए डेटा संग्रह, डेटासेट भंडारण, नीति प्रशिक्षण और हार्डवेयर इंटरफेस को कवर करने वाला एक एकीकृत ढांचा। यह 2025 और 2026 में नई रोबोट सीखने की परियोजनाओं के लिए डिफ़ॉल्ट शुरुआती बिंदु बन गया है।
लेरोबोट क्या है?
लेरोबोट हगिंग फेस द्वारा संचालित एक पायथन लाइब्रेरी है जो रोबोट सीखने के अनुसंधान के लिए एंड-टू-एंड बुनियादी ढांचा प्रदान करती है। यह चार अलग-अलग चिंताओं को संभालता है: वास्तविक हार्डवेयर से रोबोट प्रदर्शनों को रिकॉर्ड करना, मानकीकृत डेटासेट प्रारूप में उन प्रदर्शनों को संग्रहीत करना और संस्करण बनाना, उन डेटासेट पर अत्याधुनिक अनुकरण सीखने और सुदृढीकरण सीखने की नीतियों को प्रशिक्षित करना, और प्रशिक्षित नीतियों को मूल्यांकन के लिए वास्तविक हार्डवेयर पर वापस तैनात करना। इनमें से प्रत्येक क्षमता मॉड्यूलर है - आप लेरोबोट का उपयोग केवल डेटा भंडारण के लिए, या पूर्ण-स्टैक प्रशिक्षण और तैनाती के लिए कर सकते हैं।
यह परियोजना हगिंगफेस संगठन के तहत गिटहब पर चल रही है और 2026 की शुरुआत तक इसमें हजारों सितारे और सैकड़ों योगदानकर्ता जमा हो गए हैं। डेटासेट को हगिंग फेस हब से प्रकाशित और डाउनलोड किया जा सकता है, जिससे लेरोबोट को एक बढ़ती साझा डेटासेट रिपॉजिटरी मिलती है जो सामुदायिक डेटा मार्केटप्लेस के रूप में कार्य करती है।
समर्थित एल्गोरिदम
लेरोबोट तीन नीति वर्गों के मूल कार्यान्वयन के साथ जहाज करता है। एसीटी (ट्रांसफॉर्मर्स के साथ एक्शन चंकिंग) बारीक हेरफेर कार्यों के लिए प्राथमिक एल्गोरिदम है: यह टेम्पोरल असेंबलिंग के साथ ट्रांसफार्मर-आधारित सीवीएई आर्किटेक्चर का उपयोग करता है और अधिकांश कुशल हेरफेर वर्कफ़्लो के लिए अनुशंसित शुरुआती बिंदु है। डिफ्यूजन पॉलिसी एक्शन भविष्यवाणी के लिए डिनोइजिंग डिफ्यूजन के सीएनएन-आधारित और ट्रांसफॉर्मर-आधारित दोनों वेरिएंट को लागू करती है, जो मल्टीमॉडल एक्शन डिस्ट्रीब्यूशन वाले कार्यों में उत्कृष्टता प्राप्त करती है। TDMPC2 (टेम्पोरल डिफरेंस मॉडल प्रेडिक्टिव कंट्रोल) एक मॉडल-आधारित आरएल एल्गोरिदम है जो एक विश्व मॉडल और एक नीति दोनों सीखता है, एक सिमुलेशन वातावरण उपलब्ध होने पर नमूना-कुशल प्रशिक्षण प्रदान करता है।
प्रत्येक एल्गोरिदम को PyTorch में मानक प्रशिक्षण स्क्रिप्ट, हाइड्रा कॉन्फ़िगरेशन प्रबंधन और प्रयोग ट्रैकिंग के लिए वज़न और बायसेस एकीकरण के साथ कार्यान्वित किया जाता है। एल्गोरिदम के बीच स्विच करना एक एकल कॉन्फ़िगरेशन फ़ाइल परिवर्तन है, जो तुलनात्मक मूल्यांकन को सरल बनाता है।
समर्थित हार्डवेयर
आउट-ऑफ़-द-बॉक्स हार्डवेयर एकीकरण में ALOHA द्वि-मैनुअल सिस्टम (ViperX हथियार), कोच हथियार, SO-100 और SO-101 कम लागत वाले हथियार, लेकिवी मोबाइल प्लेटफ़ॉर्म और कई डायनामिक्सल सर्वो-आधारित कस्टम हथियार शामिल हैं। ओपनआर्म, एसवीआरसी के माध्यम से उपलब्ध है इकट्ठा करना, टेलीऑपरेशन रिकॉर्डिंग और नीति परिनियोजन के लिए मूल LeRobot समर्थन है। एक नए हार्डवेयर प्लेटफ़ॉर्म को जोड़ने के लिए संयुक्त स्थिति को पढ़ने और संयुक्त कमांड भेजने के तरीकों के साथ एक रोबोट इंटरफ़ेस क्लास को लागू करने की आवश्यकता होती है - आमतौर पर एक नए हाथ के लिए कोड की कुछ सौ लाइनें।
कैमरा समर्थन OpenCV, Intel RealSense डेप्थ कैमरा और वेबकैम ऐरे के माध्यम से USB कैमरों को कवर करता है। रिकॉर्डिंग सिस्टम सॉफ्टवेयर टाइमस्टैम्पिंग के साथ मल्टी-कैमरा सिंक्रोनाइज़ेशन को संभालता है और प्रति कैमरा कॉन्फ़िगर करने योग्य फ्रेम दर और रिज़ॉल्यूशन का समर्थन करता है।
लेरोबोट डेटासेट प्रारूप
LeRobot मानकीकृत एपिसोड संरचना के साथ डेटासेट को HDF5 फ़ाइलों के रूप में संग्रहीत करता है। प्रत्येक एपिसोड में अवलोकनों के लिए सरणियाँ (वीडियो स्ट्रीम के रूप में संपीड़ित छवियां, फ्लोट32 सरणियों के रूप में संयुक्त स्थिति), क्रियाएं (संयुक्त स्थिति लक्ष्य), टाइमस्टैम्प और एनोटेशन (कार्य भाषा स्ट्रिंग, सफलता ध्वज) शामिल हैं। मेटाडेटा फ़ाइलें रोबोट कॉन्फ़िगरेशन, कैमरा अंशांकन और डेटासेट आंकड़ों का वर्णन करती हैं। इस प्रारूप को स्व-वर्णन और पोर्टेबल होने के लिए डिज़ाइन किया गया है: एक मशीन पर रिकॉर्ड किए गए डेटासेट को बिना किसी संशोधन के किसी अन्य मशीन पर प्रशिक्षण के लिए लोड किया जा सकता है।
हगिंग फेस हब पर प्रकाशित डेटासेट में आंकड़े, कार्य विवरण और उपयोग के उदाहरणों के साथ एक डेटासेट कार्ड शामिल है। इससे समुदाय से डेटासेट को खोजना और पुन: उपयोग करना आसान हो जाता है, जिससे सामान्य कार्यों के लिए डेटा संग्रह का बोझ कम हो जाता है।
लेरोबोट के साथ शुरुआत करना
इंस्टालेशन के लिए Python 3.10+ और PyTorch की आवश्यकता होती है। अनुशंसित पहला प्रोजेक्ट किसी भी समर्थित हार्डवेयर पर एक सरल पिक-एंड-प्लेस कार्य के 50 प्रदर्शनों को रिकॉर्ड करना है, फिर उन प्रदर्शनों पर एक एसीटी नीति का प्रशिक्षण देना है। LeRobot का दस्तावेज़ नीति मूल्यांकन के माध्यम से हार्डवेयर सेटअप से पूर्ण पूर्वाभ्यास प्रदान करता है। अपने स्वयं के हार्डवेयर के बिना टीमों के लिए, एसवीआरसी हमारे माध्यम से रोबोट पट्टे की पेशकश करता है पट्टा कार्यक्रम विशेष रूप से LeRobot-आधारित डेटा संग्रह को सक्षम करने के लिए।
एसवीआरसी निर्यात अनुकूलता
एसवीआरसी का डेटा प्लेटफ़ॉर्म रिकॉर्डिंग सत्र से भरे गए सभी आवश्यक मेटाडेटा फ़ील्ड के साथ, मूल LeRobot HDF5 प्रारूप में डेटासेट निर्यात करता है। एसवीआरसी की सुविधा या डेटा संग्रह सेवाओं के माध्यम से एकत्र किए गए डेटासेट प्रशिक्षण के लिए तैयार होते हैं - किसी रूपांतरण चरण की आवश्यकता नहीं होती है। एसवीआरसी उन अनुसंधान भागीदारों के लिए हगिंग फेस हब पर डेटासेट होस्टिंग भी प्रदान करता है जो अपना डेटा सार्वजनिक रूप से साझा करना चाहते हैं। यदि आपके पास अपने लेरोबोट प्रशिक्षण पाइपलाइन के साथ एसवीआरसी डेटा को एकीकृत करने के बारे में प्रश्न हैं, तो एसवीआरसी इंजीनियरिंग टीम मदद के लिए उपलब्ध है.