ओपन-सोर्स वीएलए और वीएलएम रोबोट मॉडल

रोबोट हेरफेर के लिए ओपन-सोर्स विज़न-लैंग्वेज-एक्शन (वीएलए) और विज़न-लैंग्वेज (वीएलएम) मॉडल की एक क्यूरेटेड कैटलॉग - आधिकारिक साइटों, गिटहब और हगिंग फेस के लिंक के साथ।

हाई-इंटेंट मॉडल गाइड

ये पृष्ठ विशिष्ट मॉडल नाम के बजाय परिनियोजन प्रश्न, वर्कफ़्लो, या वाणिज्यिक निर्णय द्वारा खोज करने वाले उपयोगकर्ताओं को कैप्चर करते हैं।

लोकप्रिय श्रेणियां

लोकप्रिय टैग

वर्ग
टैग

रोबोटिक्स के लिए वीएलए और वीएलएम मॉडल

प्रत्येक मॉडल में विवरण, वास्तुकला, बेंचमार्क और आधिकारिक लिंक के साथ एक समर्पित पृष्ठ होता है।

OpenVLA मॉडल विज़ुअलाइज़ेशन
सीओआरएल 2025

ओपनवीएलए

7बी-पैरामीटर वीएलए। लामा 2 + DINOv2/SigLIP. ओपन एक्स-एम्बोडिमेंट से 970K डेमो। 7× कम पैरामीटर के साथ RT-2-X से बेहतर प्रदर्शन करता है। एमआईटी, गले मिलता हुआ चेहरा।

मॉडल देखें →
ऑक्टो मॉडल विज़ुअलाइज़ेशन
2024

अक्तूबर

ट्रांसफार्मर प्रसार नीति. 27एम/93एम पैरामीटर। 800K प्रक्षेप पथ। मल्टी-रोबोट, भाषा/लक्ष्य कंडीशनिंग। एमआईटी, गले मिलता हुआ चेहरा।

मॉडल देखें →
आरटी-एक्स मॉडल विज़ुअलाइज़ेशन
गूगल डीपमाइंड

आरटी-एक्स / आरटी-1-एक्स

एक्स-अवतार मॉडल खोलें। JAX और TensorFlow चौकियाँ। मल्टी-रोबोट, भाषा-वातानुकूलित। अपाचे 2.0.

मॉडल देखें →
इंटर्नवीएलए मॉडल विज़ुअलाइज़ेशन
शंघाई एआई लैब

इंटर्नवीएलए-एम1

स्थानिक रूप से निर्देशित वीएलए। दो चरण: ग्राउंडिंग + एक्शन। गूगल रोबोट पर 71-81%, 95.9% लिबरो। एमआईटी, गले मिलता हुआ चेहरा।

मॉडल देखें →
रोबोफ्लेमिंगो मॉडल विज़ुअलाइज़ेशन
बाइटडांस/सिंघुआ

रोबोफ्लेमिंगो

रोबोट नियंत्रण के लिए ओपनफ्लेमिंगो-आधारित वीएलएम। नीति प्रमुख + अनुकरण विद्या। कैल्विन पर मजबूत. एमआईटी, गले मिलता हुआ चेहरा।

मॉडल देखें →
ब्रिजवीएलए मॉडल विज़ुअलाइज़ेशन
न्यूरआईपीएस 2025

ब्रिजवीएलए

इनपुट-आउटपुट संरेखण के साथ 3डी वीएलए। 88.2% आरएलबेंच, 64% कोलोसियम। हीटमैप प्री-ट्रेनिंग + पॉइंट क्लाउड फाइन-ट्यूनिंग।

मॉडल देखें →
प्रसार नीति मॉडल विज़ुअलाइज़ेशन
कोलंबिया

प्रसार नीति

प्रसार को निरूपित करने वाली विसुओमोटर नीति। पिछले तरीकों की तुलना में +46.9%। घटता हुआ क्षितिज, समय-श्रृंखला ट्रांसफार्मर। खुला स्त्रोत।

मॉडल देखें →
लेरोबोट फ्रेमवर्क विज़ुअलाइज़ेशन
आलिंगन करता हुआ चेहरा

लेरोबोट

फ्रेमवर्क + एसीटी, स्मोलवीएलए (450एम)। एंड-टू-एंड आईएल/आरएल। डेटासेट, प्रशिक्षण, तैनाती। PyTorch, हगिंग फेस हब।

मॉडल देखें →

जोड़े जाने के लिए डेटासेट और उपकरण

व्यावहारिक मॉडल चयन

कार्य फ़िट, डेटा आवश्यकता और परिनियोजन जटिलता के आधार पर आर्किटेक्चर की तुलना करें।

डेटा-मॉडल संरेखण

मॉडल विकल्प संगत डेटासेट और प्रारूप स्टैक से जुड़े हुए हैं।

प्रयोग वेग

ओपन-सोर्स लिंक और कार्यान्वयन-तैयार पॉइंटर्स सेटअप घर्षण को कम करते हैं।

उत्पादन का पैमाना

ट्यूनिंग और एकीकरण के समर्थन के साथ मूल्यांकन से लेकर तैनाती तक।

कस्टम मॉडल या डेटा की आवश्यकता है?

हम रोबोट सीखने के लिए डेटा संग्रह, फाइन-ट्यूनिंग समर्थन और तैनाती प्रदान करते हैं।