פלטפורמות רובוטים

רובוט ALOHA: מה זה, איך זה עובד ואיך להתחיל

ALOHA היא פלטפורמת הטל-פעולה הדו-ידנית מאוניברסיטת סטנפורד שהדגימה, בפעם הראשונה, שרובוט יכול ללמוד משימות מניפולציה מיומנות בשתי ידיים - כמו פתיחת שקית צ'יפס, קשירת כבל או בישול - ממספר קטן של הדגמות אנושיות. זוהי כעת פלטפורמת המחקר הדו-ידנית הנפוצה ביותר בעולם. מדריך זה מסביר מהי ALOHA, כיצד היא פועלת וכיצד להתחיל להשתמש בה.

סיפור המקור של סטנפורד

ALOHA - מערכת חומרה בעלות נמוכה בקוד פתוח ל-Bimanual Teleoperation - פותחה במעבדת המניפולציה הניידת של סטנפורד ופורסמה במאמר "Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware" מאת Tony Z. Zhao et al. בשנת 2023. התזה המרכזית הייתה פרובוקטיבית: אינך צריך חומרת רובוט יקרה וקניינית כדי לבצע מניפולציה מיומנת מרשימה. ALOHA השתמשה בארבע זרועות רובוטים ViperX 300 ו-WidowX 250 (שתיים בכל צד, אחת כמובילה לתפעול טלפוני ואחת כעוקבת) בעלות של פחות מ-20,000$ בסך הכל, בשילוב עם אלגוריתם ACT, כדי לבצע משימות שבעבר דרשו מערכות מותאמות אישית שעלותן הרבה יותר.

העיתון הדגים 10 משימות דו-ידניות כולל פריקת חתיכת ממתק, הכנסת סוללה לחריץ והשחלת חבל דרך חור - כל אלה עם אחוזי הצלחה של מעל 80% תוך שימוש ב-50 הדגמות. תוצאות אלו זעזעו את קהילת הרובוטיקה לא בגלל שהמשימות היו חדשות, אלא בגלל העלות ויעילות הנתונים. ALOHA ו-ACT יחד הקימו אמת מידה חדשה למחקר מניפולציות זריזות נגיש והפעילו גל של עבודות המשך שנמשכות גם היום.

עיצוב החומרה של ALOHA וכל התוכנה הם קוד פתוח לחלוטין. כתב החומרים, הוראות ההרכבה וקוד ההדרכה של ACT זמינים לציבור ב-GitHub. הפתיחות הזו הפכה את ALOHA לפלטפורמת מחקר דו-ידנית סטנדרטית דה-פקטו, עם עשרות קבוצות מחקר ברחבי העולם שמריצות גרסאות של העיצוב המקורי. SVRC תומך בפלטפורמות מסוג ALOHA דרך שלנו שירותי נתונים ו תוכנית ליסינג חומרה.

ארכיטקטורת חומרה: הגדרת מנהיג-עוקבים דו-ידניים

מערכת ALOHA מורכבת משני זוגות קינמטיים, אחד לכל זרוע. לכל זוג יש זרוע "מנהיג" - זרוע קלת משקל, הניתנת לנהיגה לאחור, שהמפעיל אוחז ומזיז עם הידיים - וזרוע "עוקבת" המשקפת את עמדות המפרק של המנהיג בזמן אמת. זרוע העוקבת נושאת את המניפולטור בפועל (תופסן, כלי או גורם קצה) ומקיימת אינטראקציה עם העולם הפיזי. לזרוע המובילה אין דרישות מטען קצה מכיוון שהיא רק צריכה להיות ניתנת לנהיגה לאחור ולספק משוב מומנט למפעיל.

התצורה הדו-ידנית - שני זוגות שלמים של מנהיגים-עוקבים - היא מה שהופך את ALOHA ליכולת ייחודית למשימות זריזות. ידיים אנושיות הן דו-מנואליות מטבען: יד אחת אוחזת באובייקט בעוד השנייה מפעילה אותו, או שתי הידיים משתפות פעולה כדי להשלים משימה הדורשת שתי נקודות מגע בו-זמנית. רובוטים בעלי זרוע אחת יכולים להעריך משימות אלה רק עם מתקנים מורכבים או רצף; רובוטים דו-ידניים יכולים לטפל בהם ישירות. מקדם הצורה של ALOHA, עם שתי הזרועות מותקנות על מתקן שולחן משותף, מותאם למשימות מניפולציה על השולחן שבהן המפעיל יושב מול המערכת.

מערך המצלמה בנייר ALOHA המקורי השתמש בשלוש מצלמות: אחת מעל הראש (ממעוף ציפור של סביבת העבודה המלאה), אחת על פרק כף יד שמאל ואחת על פרק כף יד ימין. כל שלוש המצלמות משמשות כתצפיות חזותיות עבור מדיניות ACT. ההגדרה מרובת התצוגה הזו היא קריטית: מצלמות פרק כף היד מספקות תצוגות מקרוב של אירועי אחיזה ומגע, בעוד שהמצלמה העליונה מספקת הקשר גלובלי לתיאום בשתי ידיים. גרסאות ALOHA של מצלמה אחת מציגות ביצועי מדיניות נמוכים למדי במשימות כבדות תיאום.

ACT: האלגוריתם מאחורי ALOHA

ACT (Action Chunking with Transformers) פותח לצד ALOHA והוא אלגוריתם הלמידה העיקרי של הפלטפורמה. ACT היא מדיניות למידה חיקוי המבוססת על שנאים שחוזה נתח של עמדות משותפות עתידיות - בדרך כלל 100 צעדי זמן ב-50Hz, המכסים 2 שניות של תנועה - במקום פעולה אחת הבאה. ארכיטקטורת נתחי פעולה זו מפחיתה באופן מהותי את בעיית השגיאות המורכבות של שיבוט התנהגותי נאיבי, שבו טעויות חיזוי קטנות בכל צעד זמן מצטברות לסטיות מסלול גדולות במהלך משימה.

ארכיטקטורת המדיניות של ACT משתמשת במקודד CVAE (Conditional Variational Autoencoder) במהלך האימון כדי ללכוד את הסגנון הסמוי של כל הדגמה - בעצם, ייצוג דחוס של "איך" האדם השלים את המשימה, להבדיל מ"מה" הייתה תוצאת המשימה. זה מאפשר למדיניות לדגמן את השונות הטבעית בהפגנות אנושיות ללא חפצים של ממוצע מצבים. בזמן מסקנות, רק מפענח ה- CVAE פועל, מותנה בתצפית הנוכחית ובוקטור סמוי מדוגם, כדי ליצור את נתח הפעולה.

אימון ACT על מערך נתונים של ALOHA עם 50 הדגמות לכל משימה נמשך 2-4 שעות על GPU יחיד של RTX 3090. קוד ההדרכה, שפורסם עם המאמר המקורי, הוא פשוט להפעלה עם היפרפרמטרים מתועדים עבור משימות ALOHA סטנדרטיות. עבור משימות מותאמות אישית, ההיפרפרמטר המשפיע ביותר לכוונון הוא גודל הנתח (kl_weight בתצורה) - נתחים גדולים יותר משפרים את העקביות הזמנית במחיר של תגובתיות להפרעות בלתי צפויות. של SVRC פּלַטפוֹרמָה כולל צינורות אימון ACT מוגדרים מראש עבור מערכי נתונים בפורמט ALOHA.

נייד ALOHA: הורדת ALOHA מהשולחן

Mobile ALOHA, שפורסם על ידי אותה קבוצת סטנפורד ב-2024, הרחיב את קונספט ALOHA לבסיס נייד. מערך הזרוע הדו-ידנית הותקן על בסיס נייד AgileX Tracer, המאפשר למערכת לנווט למיקומים שונים בחלל - התקרבות לדלפק מטבח, מעבר לשולחן אוכל, ניווט במסדרון - תוך שמירה על זרועות ALOHA לצורך מניפולציה. Mobile ALOHA הדגים משימות כמו בישול שרימפס על כיריים, העמסת מדיח כלים ומשלוח חבילה - משימות הדורשות גם תנועה וגם מניפולציה זריזה.

Mobile ALOHA הציגה את המושג טלאופרציה לכל הגוף: המפעיל שולט הן בבסיס הנייד והן בשתי הזרועות בו זמנית, או באמצעות ממשקי בקרה נפרדים או באמצעות ממשק אחיד הממפה את תנועות הגוף של המפעיל לתצורת כל הגוף של הרובוט. איסוף נתונים עבור ALOHA לנייד מורכב משמעותית מ-ALOHA שולחני מכיוון שהמדיניות חייבת ללמוד לתאם ניווט ומניפולציה, הדורשת הדגמות המכסות שונות מרחביות בסביבה כמו גם שונות אובייקט.

Mobile ALOHA הציגה גם אימון משותף: אימון מדיניות Mobile ALOHA במשותף על הדגמות מניפולציות ניידות והדגמות מניפולציה סטטיות של ALOHA. האימון המשותף שיפר את ביצועי המניפולציה בפלטפורמה הניידת, מה שמצביע על כך שידע המניפולציה הדו-ידנית מנתוני שולחן מועבר בצורה שימושית להקשר הנייד. SVRC מציעה מערכי נתונים תואמי ALOHA לנייד ויכולה לאסוף הדגמות של מניפולציה ניידת במתקן San Francisco שלנו. צור איתנו קשר כדי לדון בדרישות הנתונים של ALOHA לנייד שלך.

הבדלים בין ALOHA, ALOHA 2 ונגזרות מסחריות

ALOHA 2, שפורסם בסוף 2024, השתפר על המקור במספר ממדים: זרועות איכותיות יותר עם יכולת חזרה טובה יותר, מערכת הרכבה משופרת למצלמה ועיצוב שורש כף היד מתוקן שמפחית את מורכבות ניתוב הכבלים. מערכת החשמל עודכנה גם כך שתשתמש בלוח חלוקת חשמל ייעודי במקום בכבלי חשמל משולבים, מה שמשפר את האמינות במהלך הפעלות ארוכות של איסוף נתונים. ALOHA 2 שומר על תאימות תוכנה מלאה למקור - מערכי נתונים שנאספים באחד יכולים להכשיר מדיניות המוערכת מצד שני, בכפוף להסתייגות הרגילות לגבי וריאציות חומרה.

מספר ספקים מסחריים מוכרים כעת פלטפורמות תואמות ALOHA - מערכות מורכבות מראש, בדוקות העוקבות אחר מפרט המכאני והתוכנה של ALOHA מבלי לדרוש מהבנאי לספק רכיבים ולהרכיב את הזרועות בעצמן. מערכות ALOHA מסחריות אלו עולות יותר ממוצר עשה זאת בעצמך, אך מפחיתות באופן משמעותי את זמן ההתקנה ואת הסיכון לטעויות בהרכבה. קטלוג החומרה של SVRC כולל תצורות תואמות ALOHA; לראות את חנות עבור אפשרויות ותמחור עדכניות.

תחילת העבודה עם ALOHA דרך SVRC

SVRC תומך במחקר מבוסס ALOHA בכל שלב. לצוותים שרק מתחילים, אנו מציעים השכרה של פלטפורמת ALOHA דרך שלנו תוכנית ליסינג רובוטים - גישה להגדרה דו-ידנית מלאה תמורת תשלום חודשי קבוע ללא התחייבות הונית של רכישת חומרה. מערכות מושכרות מגיעות מכוילות מראש ומוכנות לאיסוף הדגמות ביום הראשון.

לאיסוף נתונים, שלנו שירות מנוהל מספקת מפעילי ALOHA מאומנים שיכולים לאסוף הדגמות במתקן San Francisco שלנו, עם מערכי נתונים המסופקים בפורמט RLDS/LeRobot התואמים ל-ACT, Diffusion Policy וצינורות ההדרכה של OpenVLA. המפעילים שלנו מנוסים במשימות תיאום דו-ידניות ועוקבים אחר פרוטוקולי איכות מובנים המייצרים מערכי נתונים נקיים יותר ממה שחוקרים לראשונה משיגים בדרך כלל. אנחנו יכולים גם לבקר באתר שלך לקמפיינים לאיסוף נתונים במקום אם המשימה שלך דורשת זאת.

להדרכה והערכה של מדיניות, ה פלטפורמת SVRC מספק צינורות אימון ACT מוגדרים מראש, מעקב אחר ניסויים וכלי הערכה עבור מדיניות ALOHA. שֶׁלָנוּ אמות מידה כלול הערכות משימות ספציפיות ל-ALOHA המאפשרות לך להשוות את ביצועי המדיניות שלך מול יישומי התייחסות. בין אם אתה בונה מאפס תוכנית מחקר מניפולציה דו-ידנית או מנסה לדחוף את הביצועים של מערכת קיימת, הצוות של SVRC יכול לעזור לך לתכנן את הגישה הנכונה.