InternVLA-M1
מסגרת חזון-שפה-פעולה מונחה מרחבית למדיניות רובוטים כללית. מעבדת בינה מלאכותית של שנחאי.
סקירה כללית
InternVLA-M1 משתמש בצינור דו-שלבי: (1) אימון מקדים של הארקה מרחבית על 2.3 מיליון דגימות כדי לקבוע "היכן לפעול", (2) פעולה מונחית מרחבית לאחר אימון עבור "איך לפעול". מודולרי, ניתן להרחבה, עם פיקוח כפול.
אמות מידה
- רובוט גוגל 71.7% (WidowX), 76.0% (VM), 80.7% (VA)
- LIBERO 95.9% הצלחה
- +14.6% על SimplerEnv, +20.6% על עצמים בלתי נראים עם אימון משותף סינתטי
קישורים רשמיים
- internrobotics.github.io/internvla-m1 - אתר הפרויקט
- github.com/InternRobotics/InternVLA-M1 - קוד (עם)
- פנים מחבקות: InternRobotics - מודלים ומערכים
צִיטָטָה
עיין באתר הפרויקט עבור BibTeX והפניות לנייר.