ओपन-सोर्स वीएलए और वीएलएम रोबोट मॉडल

रोबोट हेरफेर के लिए ओपन-सोर्स विज़न-लैंग्वेज-एक्शन (वीएलए) और विज़न-लैंग्वेज (वीएलएम) मॉडल की एक क्यूरेटेड कैटलॉग - आधिकारिक साइटों, गिटहब और हगिंग फेस के लिंक के साथ।

संग्रह

फाउंडेशन वीएलए मॉडल

मल्टी-रोबोट, मल्टी-टास्क डेटा के साथ प्रशिक्षित बड़े पैमाने के एक्शन मॉडल।

संग्रह

मॉडल तुलना ट्रैक

आमतौर पर बेंचमार्क-शैली के साथ-साथ मूल्यांकन के लिए उपयोग किए जाने वाले मॉडल।

संग्रह

नीति शिक्षण मॉडल

व्यावहारिक आईएल/आरएल नीति प्रशिक्षण लूप के लिए अनुकूलित आर्किटेक्चर।

विषय समूह

हाई-इंटेंट मॉडल गाइड

ये पृष्ठ विशिष्ट मॉडल नाम के बजाय परिनियोजन प्रश्न, वर्कफ़्लो, या वाणिज्यिक निर्णय द्वारा खोज करने वाले उपयोगकर्ताओं को कैप्चर करते हैं।

मॉडल गाइड

रोबोटिक्स के लिए वीएलए मॉडल

फाउंडेशन एक्शन मॉडल, ट्रेड-ऑफ़ और फिट।

वर्कफ़्लो गाइड

टेलिओप बूटस्ट्रैपिंग मॉडल

जब प्रदर्शन आपका शुरुआती बिंदु हो तो सबसे अच्छा क्या काम करता है।

हेरफेर गाइड

संपर्क-समृद्ध मॉडल

बल, स्पर्श संकेत, और पुनर्प्राप्ति-जागरूक नीति विकल्प।

निर्णय मार्गदर्शिका

फाउंडेशन बनाम कार्य नीतियां

व्यापक क्षमता बनाम तेज़ संकीर्ण तैनाती।

निर्णय मार्गदर्शिका

रोबोट मॉडल कैसे चुनें

डेटा, कार्य का दायरा, मूल्यांकन और परिनियोजन बाधाएँ।

ओपनआर्म गाइड

ओपनआर्म मॉडल

ओपनआर्म के लिए नीति विकल्प और व्यावहारिक शुरुआती रास्ते।

त्वरित ब्राउज़ करें

रोबोटिक्स के लिए वीएलए और वीएलएम मॉडल

प्रत्येक मॉडल में विवरण, वास्तुकला, बेंचमार्क और आधिकारिक लिंक के साथ एक समर्पित पृष्ठ होता है।

सीओआरएल 2025

ओपनवीएलए

7बी-पैरामीटर वीएलए। लामा 2 + DINOv2/SigLIP. ओपन एक्स-एम्बोडिमेंट से 970K डेमो। 7× कम पैरामीटर के साथ RT-2-X से बेहतर प्रदर्शन करता है। एमआईटी, गले मिलता हुआ चेहरा।

मॉडल देखें →