डेटा गुणवत्ता मात्रा से अधिक क्यों मायने रखती है?

रोबोट सीखने में एक आम ग़लतफ़हमी यह है कि अधिक प्रदर्शन स्वचालित रूप से एक बेहतर नीति तैयार करते हैं। यह गलत है। तंत्रिका नेटवर्क नकल करना सीखते हैं वितरण आपके डेटासेट में व्यवहार का। यदि आपका प्रदर्शन असंगत है - अलग-अलग पथ, अलग-अलग गति, अलग-अलग ऑब्जेक्ट स्थिति - तो नेटवर्क एक धुंधला औसत सीखता है जो किसी भी वास्तविक सफल रणनीति के अनुरूप नहीं होता है।

50 प्रदर्शन जहां हाथ एक ही साफ रास्ता अपनाता है, एक ही स्थान पर वस्तु को पकड़ता है, और उसी घरेलू स्थिति में लौटता है, एक ऐसी नीति तैयार करेगा जो उच्च भिन्नता के साथ 500 प्रदर्शनों से बेहतर सामान्यीकरण करेगी। पहला संग्रह सत्र उस स्थिरता को स्थापित करने का आपका मौका है। पर्याप्त समय लो। जो भी डेमो गलत लगे उसे हटा दें और दोबारा रिकॉर्ड करें।

पाइपलाइन डिज़ाइन में गहरी ग्राउंडिंग के लिए, पढ़ें डेटा संग्रह पाइपलाइन सिंहावलोकन रोबोटिक्स लाइब्रेरी में.

लेरोबोट डेटासेट प्रारूप

आपकी रिकॉर्डिंग सहेजी जाएगी लेरोबोट प्रारूप - हगिंग फेस की लेरोबोट लाइब्रेरी द्वारा उपयोग किया जाने वाला मानक और यूनिट 5 में आपके द्वारा उपयोग किए जाने वाले एसीटी और डिफ्यूजन पॉलिसी प्रशिक्षकों के साथ संगत।

क्या रिकार्ड किया जाता है

संयुक्त स्थिति (6 डीओएफ + ग्रिपर), संयुक्त वेग, अंत-प्रभावक मुद्रा, कैमरा फ्रेम (आरजीबी + वैकल्पिक गहराई), टाइमस्टैम्प और कार्य मेटाडेटा।

फ़ाइल संरचना

प्रति एपिसोड एक फ़ोल्डर. प्रत्येक एपिसोड में एक शामिल है data.parquet राज्य/कार्रवाई सरणियों के साथ और ए video/ कैमरा स्ट्रीम के साथ सबफ़ोल्डर।

नमूना दर

डिफ़ॉल्ट रूप से 50Hz. टेलीऑपरेशन का प्रत्येक सेकंड 50 टाइमस्टेप उत्पन्न करता है। 10 सेकंड का पिक-एंड-प्लेस 500 (स्टेट, एक्शन) जोड़े बनाता है।

अनुकूलता

LeRobot प्रारूप सीधे लोड होता है lerobot.common.datasets. यह टीएफ-एजेंट पाइपलाइनों के लिए आरएलडीएस में भी परिवर्तनीय है। संदर्भ डेटासेट ब्राउज़ करें →

आपका रिकॉर्डिंग सत्र

अपने कार्य के नाम और लक्ष्य एपिसोड संख्या के साथ रिकॉर्डिंग स्क्रिप्ट लॉन्च करें। स्क्रिप्ट स्वचालित रूप से एपिसोड प्रबंधन, फ़ाइल नामकरण और गुणवत्ता फ़्लैगिंग को संभालती है:

# Activate your environment first स्रोत ~/ओपनआर्म-एनवी/बिन/सक्रिय करें # Launch recording — saves to ~/openarm-datasets/pick-and-place/ पायथन -एम ओपनआर्म.कलेक्ट \ --कार्य चुनें-और-स्थान \ --एपिसोड 50 \ --एफपीएस 50 \ --आउटपुट ~/ओपनआर्म-डेटासेट/पिक-एंड-प्लेस # Press ENTER to start a new episode, BACKSPACE to discard the last one # The script prints a summary after every 10 episodes

प्रत्येक एपिसोड के लिए समान आरंभिक स्थिति में समान ऑब्जेक्ट के साथ अपना कार्यक्षेत्र सेट करें। वस्तु की स्थिति को एक समान बनाए रखने के लिए मेज पर टेप के निशान का प्रयोग करें। प्रत्येक एपिसोड शुरू होने से पहले आपका हाथ बिल्कुल उसी घरेलू मुद्रा में लौट आना चाहिए - रिकॉर्डिंग स्क्रिप्ट इसे होमिंग चेक के साथ लागू करती है।

व्यावहारिक युक्ति: प्रत्येक 8-15 सेकंड के बीच के एपिसोड का लक्ष्य रखें। बहुत छोटा (5 से कम) और नीति के पास सुचारू प्रक्षेप पथ की योजना बनाने का समय नहीं है। बहुत लंबा (20 से अधिक) और छोटी भिन्नताएं मिश्रित होती हैं। एक मानक पिक-एंड-प्लेस के लिए, प्रति एपिसोड 10 सेकंड का लक्ष्य है।

डेटा गुणवत्ता चेकलिस्ट

इकाई 5 पर आगे बढ़ने से पहले, सत्यापित करें कि आपका डेटासेट इनमें से सभी पाँच जाँचों पर खरा उतरा है। किसी भी आइटम में विफल होने वाले एपिसोड को त्यागें और पुनः रिकॉर्ड करें।

  • 1 कोई असफल पकड़ नहीं. प्रत्येक एपिसोड ऑब्जेक्ट को लक्ष्य स्थान पर सफलतापूर्वक रखे जाने के साथ समाप्त होता है। ऐसे एपिसोड जहां हाथ पकड़ से चूक गया या वस्तु गिर गई, उन्हें हटा दिया जाना चाहिए - वे मॉडल को विफल होना सिखाते हैं।
  • 2 लगातार आरंभ मुद्रा. हर एपिसोड में हाथ घरेलू स्थिति से शुरू होता है। डेटासेट व्यूअर में सत्यापित करें कि टाइमस्टेप 0 पर संयुक्त कोण सभी 50 एपिसोड में एक दूसरे के ±2° के भीतर हैं।
  • 3 कोई अचानक उछाल या झटका नहीं. 3-5 यादृच्छिक एपिसोड की कल्पना करें python -m lerobot.visualize_dataset --dataset ~/openarm-datasets/pick-and-place. एक्शन सीक्वेंस चिकने निरंतर मोड़ वाले होने चाहिए, स्पाइक्स वाले नहीं।
  • 4 कैमरे के फ्रेम स्पष्ट और फोकस में हैं। जांचें कि आपके कार्यस्थल का कैमरा बंद नहीं है, सीधी रोशनी से बुझ नहीं गया है, और प्रत्येक एपिसोड में वस्तु स्पष्ट रूप से दिखाई दे रही है। धुंधला या गहरा वीडियो नीति प्रदर्शन को ख़राब करता है।
  • 5 50 पूर्ण एपिसोड सहेजे गए। दौड़ना python -m lerobot.inspect ~/openarm-datasets/pick-and-place और पुष्टि करें कि आपके पास बिल्कुल 50 एपिसोड हैं जिनमें कोई दूषित फ़ाइलें नहीं हैं। स्क्रिप्ट गायब फ़्रेमों या काटे गए एक्शन दृश्यों वाले किसी भी एपिसोड को चिह्नित करेगी।

तुलना के लिए संदर्भ डेटासेट ब्राउज़ करें

एसवीआरसी डेटासेट लाइब्रेरी में उदाहरण पिक-एंड-प्लेस रिकॉर्डिंग शामिल हैं जिन्हें आप गुणवत्ता संदर्भ के रूप में उपयोग कर सकते हैं। यदि आपका डेटा काफी भिन्न दिखता है, तो प्रशिक्षण से पहले जांच करें। एसवीआरसी डेटासेट खोलें →

इकाई 4 पूर्ण जब...

आपके पास LeRobot प्रारूप में 50 साफ़ एपिसोड सहेजे गए हैं ~/openarm-datasets/pick-and-place. गुणवत्ता जांच सूची के सभी पांच आइटम पास हो गए। दौड़ना lerobot.inspect 50 एपिसोड दिखाता है, कोई त्रुटि नहीं। आप इस डेटासेट को यूनिट 5 में प्रशिक्षण पाइपलाइन को सौंपने के लिए तैयार हैं।