डेटा गुणवत्ता मात्रा से अधिक क्यों मायने रखती है?
रोबोट सीखने में एक आम ग़लतफ़हमी यह है कि अधिक प्रदर्शन स्वचालित रूप से एक बेहतर नीति तैयार करते हैं। यह गलत है। तंत्रिका नेटवर्क नकल करना सीखते हैं वितरण आपके डेटासेट में व्यवहार का। यदि आपका प्रदर्शन असंगत है - अलग-अलग पथ, अलग-अलग गति, अलग-अलग ऑब्जेक्ट स्थिति - तो नेटवर्क एक धुंधला औसत सीखता है जो किसी भी वास्तविक सफल रणनीति के अनुरूप नहीं होता है।
50 प्रदर्शन जहां हाथ एक ही साफ रास्ता अपनाता है, एक ही स्थान पर वस्तु को पकड़ता है, और उसी घरेलू स्थिति में लौटता है, एक ऐसी नीति तैयार करेगा जो उच्च भिन्नता के साथ 500 प्रदर्शनों से बेहतर सामान्यीकरण करेगी। पहला संग्रह सत्र उस स्थिरता को स्थापित करने का आपका मौका है। पर्याप्त समय लो। जो भी डेमो गलत लगे उसे हटा दें और दोबारा रिकॉर्ड करें।
पाइपलाइन डिज़ाइन में गहरी ग्राउंडिंग के लिए, पढ़ें डेटा संग्रह पाइपलाइन सिंहावलोकन रोबोटिक्स लाइब्रेरी में.
लेरोबोट डेटासेट प्रारूप
आपकी रिकॉर्डिंग सहेजी जाएगी लेरोबोट प्रारूप - हगिंग फेस की लेरोबोट लाइब्रेरी द्वारा उपयोग किया जाने वाला मानक और यूनिट 5 में आपके द्वारा उपयोग किए जाने वाले एसीटी और डिफ्यूजन पॉलिसी प्रशिक्षकों के साथ संगत।
क्या रिकार्ड किया जाता है
संयुक्त स्थिति (6 डीओएफ + ग्रिपर), संयुक्त वेग, अंत-प्रभावक मुद्रा, कैमरा फ्रेम (आरजीबी + वैकल्पिक गहराई), टाइमस्टैम्प और कार्य मेटाडेटा।
फ़ाइल संरचना
प्रति एपिसोड एक फ़ोल्डर. प्रत्येक एपिसोड में एक शामिल है data.parquet राज्य/कार्रवाई सरणियों के साथ और ए video/ कैमरा स्ट्रीम के साथ सबफ़ोल्डर।
नमूना दर
डिफ़ॉल्ट रूप से 50Hz. टेलीऑपरेशन का प्रत्येक सेकंड 50 टाइमस्टेप उत्पन्न करता है। 10 सेकंड का पिक-एंड-प्लेस 500 (स्टेट, एक्शन) जोड़े बनाता है।
अनुकूलता
LeRobot प्रारूप सीधे लोड होता है lerobot.common.datasets. यह टीएफ-एजेंट पाइपलाइनों के लिए आरएलडीएस में भी परिवर्तनीय है। संदर्भ डेटासेट ब्राउज़ करें →
आपका रिकॉर्डिंग सत्र
अपने कार्य के नाम और लक्ष्य एपिसोड संख्या के साथ रिकॉर्डिंग स्क्रिप्ट लॉन्च करें। स्क्रिप्ट स्वचालित रूप से एपिसोड प्रबंधन, फ़ाइल नामकरण और गुणवत्ता फ़्लैगिंग को संभालती है:
प्रत्येक एपिसोड के लिए समान आरंभिक स्थिति में समान ऑब्जेक्ट के साथ अपना कार्यक्षेत्र सेट करें। वस्तु की स्थिति को एक समान बनाए रखने के लिए मेज पर टेप के निशान का प्रयोग करें। प्रत्येक एपिसोड शुरू होने से पहले आपका हाथ बिल्कुल उसी घरेलू मुद्रा में लौट आना चाहिए - रिकॉर्डिंग स्क्रिप्ट इसे होमिंग चेक के साथ लागू करती है।
व्यावहारिक युक्ति: प्रत्येक 8-15 सेकंड के बीच के एपिसोड का लक्ष्य रखें। बहुत छोटा (5 से कम) और नीति के पास सुचारू प्रक्षेप पथ की योजना बनाने का समय नहीं है। बहुत लंबा (20 से अधिक) और छोटी भिन्नताएं मिश्रित होती हैं। एक मानक पिक-एंड-प्लेस के लिए, प्रति एपिसोड 10 सेकंड का लक्ष्य है।
डेटा गुणवत्ता चेकलिस्ट
इकाई 5 पर आगे बढ़ने से पहले, सत्यापित करें कि आपका डेटासेट इनमें से सभी पाँच जाँचों पर खरा उतरा है। किसी भी आइटम में विफल होने वाले एपिसोड को त्यागें और पुनः रिकॉर्ड करें।
- कोई असफल पकड़ नहीं. प्रत्येक एपिसोड ऑब्जेक्ट को लक्ष्य स्थान पर सफलतापूर्वक रखे जाने के साथ समाप्त होता है। ऐसे एपिसोड जहां हाथ पकड़ से चूक गया या वस्तु गिर गई, उन्हें हटा दिया जाना चाहिए - वे मॉडल को विफल होना सिखाते हैं।
- लगातार आरंभ मुद्रा. हर एपिसोड में हाथ घरेलू स्थिति से शुरू होता है। डेटासेट व्यूअर में सत्यापित करें कि टाइमस्टेप 0 पर संयुक्त कोण सभी 50 एपिसोड में एक दूसरे के ±2° के भीतर हैं।
-
कोई अचानक उछाल या झटका नहीं. 3-5 यादृच्छिक एपिसोड की कल्पना करें
python -m lerobot.visualize_dataset --dataset ~/openarm-datasets/pick-and-place. एक्शन सीक्वेंस चिकने निरंतर मोड़ वाले होने चाहिए, स्पाइक्स वाले नहीं। - कैमरे के फ्रेम स्पष्ट और फोकस में हैं। जांचें कि आपके कार्यस्थल का कैमरा बंद नहीं है, सीधी रोशनी से बुझ नहीं गया है, और प्रत्येक एपिसोड में वस्तु स्पष्ट रूप से दिखाई दे रही है। धुंधला या गहरा वीडियो नीति प्रदर्शन को ख़राब करता है।
-
50 पूर्ण एपिसोड सहेजे गए। दौड़ना
python -m lerobot.inspect ~/openarm-datasets/pick-and-placeऔर पुष्टि करें कि आपके पास बिल्कुल 50 एपिसोड हैं जिनमें कोई दूषित फ़ाइलें नहीं हैं। स्क्रिप्ट गायब फ़्रेमों या काटे गए एक्शन दृश्यों वाले किसी भी एपिसोड को चिह्नित करेगी।
तुलना के लिए संदर्भ डेटासेट ब्राउज़ करें
एसवीआरसी डेटासेट लाइब्रेरी में उदाहरण पिक-एंड-प्लेस रिकॉर्डिंग शामिल हैं जिन्हें आप गुणवत्ता संदर्भ के रूप में उपयोग कर सकते हैं। यदि आपका डेटा काफी भिन्न दिखता है, तो प्रशिक्षण से पहले जांच करें। एसवीआरसी डेटासेट खोलें →
इकाई 4 पूर्ण जब...
आपके पास LeRobot प्रारूप में 50 साफ़ एपिसोड सहेजे गए हैं ~/openarm-datasets/pick-and-place. गुणवत्ता जांच सूची के सभी पांच आइटम पास हो गए। दौड़ना lerobot.inspect 50 एपिसोड दिखाता है, कोई त्रुटि नहीं। आप इस डेटासेट को यूनिट 5 में प्रशिक्षण पाइपलाइन को सौंपने के लिए तैयार हैं।