द्वि-मैनुअल डेटा संग्रहण कठिन क्यों है?
एकल-हाथ डेटा संग्रह में, एक खराब प्रदर्शन केवल एक हाथ के प्रक्षेप पथ को प्रभावित करता है। आप 50 डेमो रिकॉर्ड करते हैं, 5 ख़राब डेमो हटाते हैं, और 45 पर प्रशिक्षण लेते हैं। द्वि-मैनुअल डेटा संग्रह में, हैंडऑफ़ बिंदु पर एक गलती अमान्य हो जाती है दोनों उस डेमो के लिए हथियारों के प्रक्षेप पथ एक साथ। विफलता मोड युग्मित हैं.
इस युग्मन के दो व्यावहारिक निहितार्थ हैं। सबसे पहले, आपको अधिक प्रदर्शनों की आवश्यकता है - 50 के बजाय 100 - क्योंकि द्वि-मैन्युअल कार्यों में अधिक भिन्नता होती है और समन्वय संरचना को सीखने के लिए नीति को अधिक उदाहरणों की आवश्यकता होती है। दूसरा, आपको प्रति प्रदर्शन सख्त स्थिरता की आवश्यकता है। एक सिंगल-आर्म डेमो जो कि 80% लगातार अच्छी तरह से ट्रेन करता है। एक द्वि-मैनुअल डेमो जहां एक हाथ सुसंगत है और दूसरा भिन्न है, नीति को समन्वय समय के बारे में कुछ भी उपयोगी नहीं सिखाता है।
कार्यक्षेत्र कवरेज चुनौती भी बड़ी है: आपको फ्रेम में दोनों भुजाओं की आवश्यकता है, और हैंडऑफ़ बिंदु - उच्चतम-जटिलता वाला क्षण - कम से कम एक कैमरे द्वारा विश्वसनीय रूप से कैप्चर किया जाना चाहिए। शुरू करने से पहले अपने कैमरे के कोण की जांच करें और यदि हैंडऑफ़ कार्यस्थल कैमरे के दृश्य क्षेत्र के बाहर होता है तो समायोजित करें।
लेरोबोट द्विमान्य डेटासेट प्रारूप
LeRobot के साथ DK1 एकीकरण दोहरे संयुक्त-राज्य सरणियों के साथ मानक सिंगल-आर्म प्रारूप का विस्तार करता है। डेटासेट में प्रत्येक टाइमस्टेप में शामिल हैं:
सिंगल-आर्म से मुख्य अंतर: एक्शन स्पेस 14-आयामी (6+6 जोड़ + 2 ग्रिपर) है। ACT इसे मूल रूप से संभालता है - आप प्रशिक्षण कॉन्फ़िगरेशन में कार्रवाई आयाम निर्दिष्ट करते हैं और किसी अन्य परिवर्तन की आवश्यकता नहीं होती है।
रिकॉर्डिंग वर्कफ़्लो
कार्य के लिए अपनी मोटर मेमोरी को गर्म करने के लिए रिकॉर्डिंग सत्र शुरू करने से पहले 10-15 अभ्यास डेमो चलाएँ। पहले 5-10 रिकॉर्ड किए गए डेमो आपके सबसे खराब होंगे - ऐसी उम्मीद है। सत्र के दौरान उनकी समीक्षा करने के लिए न रुकें; पूरे 100 रिकॉर्ड हो जाने के बाद समीक्षा करें और ख़राब डेमो हटाएँ।
द्वि-मैनुअल डेटा के लिए गुणवत्ता जांच सूची
लेरोबोट के रीप्ले व्यूअर का उपयोग करके रिकॉर्डिंग के बाद प्रत्येक डेमो की समीक्षा करें। ऐसे किसी भी डेमो को त्यागें जो इनमें से दो या अधिक मानदंडों में विफल रहता है:
इकाई 4 पूर्ण जब...
आपके पास LeRobot प्रारूप में 100 रिकॉर्ड किए गए प्रदर्शन हैं ~/dk1-datasets/cube-handoff-v1/. समीक्षा और चयन के बाद, कम से कम 90 डेमो गुणवत्ता जांच सूची में उत्तीर्ण होते हैं। दोनों संयुक्त राज्य सरणियाँ प्रत्येक एपिसोड के लिए 50Hz पर मौजूद हैं। दोनों कैमरा फ़ीड मौजूद हैं और हैंडऑफ़ क्षण सहित पूरा कार्य अनुक्रम दिखाते हैं। आप दौड़ चुके हैं python -m lerobot.scripts.visualize_dataset --repo-id cube-handoff-v1 और पुष्टि की गई कि डेटासेट संरचना वैध है।