הגישה שלנו
בינה מלאכותית פיזית ממוקדת באדם. אנו מתמקדים בלולאת הנתונים שגורמת למידת רובוטים להתאים למעשה - לא הפלטפורמה הגדולה ביותר, אבל זו שהצוותים לא יכולים להחליף.
הלולאה הסגורה שאנו מייעלים עבורה
לולאת הנתונים
אתגר הליבה בלמידת רובוטים אינו גודל המודל - הוא כן נְתוּנִים. מאיפה זה מגיע, איך זה הופך שמיש ואיך מקורות שונים משתלבים. אנחנו בונים את הלולאה הסגורה שהופכת כישלונות בעולם האמיתי לסבב האימונים הבא.
פרק אמיתי ← חבילה מובנית ← ריצת Benchmark ← שידור חוזר של כשלים ← חזרה לאימון.
ברגע שלקוחות מעלים יומני כשלים, מקבלים דוחות אוטומטיים של הפעלה חוזרת ומדידות, ומריצים מבחני A/B של מדיניות דרך המערכת שלנו, הם מתחילים להיות תלויים בזה. זה החפיר.
מה אנחנו מודדים
כוכב הצפון שלנו אינו נפח קוד או גודל דגם. אלה חמשת המספרים האלה:
- זמן כניסת רובוט חדש למטוס — באיזו מהירות יכולה פלטפורמה חדשה להתחבר?
- משימה חדשה לקו הבסיס הראשון - מהפגנה למדיניות הניתנת להפעלה
- זמן אימון מחדש של כישלון בודד — באיזו מהירות כשל נכנס שוב לסיבוב האימונים הבא?
- כיסוי הערכה אוטומטי - איזה אחוז מההחלטות מסתמכות על המדד שלנו?
- תלות שבועית בלקוח — כמה החלטות ללכת/לא ללכת זורמות במערכת שלנו?
מקורות נתונים שאנו מאחדים
נתוני אימון רובוטים מגיעים מחמישה מסלולים עיקריים. אין מקור אחד מספיק - העתיד הוא שילוב נתונים הטרוגני.
- סרטון אנושי באינטרנט - קנה מידה ומקודם, אך ללא תוויות פעולה. אנו משתמשים בו למבנה משימות, לא לפקודות מנוע גולמי.
- נתונים סינתטיים - יצירה אוטומטית, אך פער Sim2Real. אנו מתמקדים בעיצוב תגמול ואקראי של תחום.
- לכידת תנועה - דיוק גבוה, נייד. גשר בין וידאו לביצוע רובוט.
- הפעלה טלפונית של רובוט - רוב פריסה מיושרת, אבל יקר. אנו מייעלים עבור יעילות וזרימת תיקון בסגנון RECAP.
- שילוב הטרוגני - חוצה משימות, חוצה רובוט, חוצה אופנים. הגבול האמיתי.
ייצוג נתונים חשוב יותר מנפח גולמי. אנחנו הופכים פרקים למנות מובנות, כשלים למקרים מוכנים לאימון, ומדדים למשטחי החלטה.
שישה חצבים שאנו בונים
- חפיר נתונים - לא הכי הרבה נתונים, אבל הכי נדירים: כשלים אמיתיים, תיקונים, היסטוריית eval, יישור חוצה רובוטים.
- חפיר בנצ'מרק — ההחלטות של לקוחות ללכת/לא ללכת תלויות יותר ויותר במבחן המדד שלנו.
- חפיר מתאם - רובוט חדש ומהירות הכניסה של התקן קלט חדש כיתרון הכניסה החזק ביותר.
- חפיר זרימת עבודה - מחקר, הנדסה, בדיקות ומבצעים רואים כולם את אותן עובדות.
- חפיר מתאם Real–Sim - תוצאות ההשוואה שלנו מנבאות ביצועים בעולם האמיתי.
- חפיר יחסים מסחריים — מ"נסה את הכלי הזה" ועד "אנחנו בודקים את הדוח שלך מדי יום, מקבלים החלטות מדי שבוע."
Contact-Rich & Tactile
אנו מתמחים ב מניפולציה עשירה במגע - הכנסה, הרכבה, משימות רגישות לכוח. צוותים רבים עושים חזון; הלולאה הסגורה האמיתית למשימות מגע קשה יותר. אנו משלבים אותות מישוש, מומנט וכוח לתוך לולאת הנתונים והדרכת מדיניות.
רובוט למידה סביבת והערכה כשירות
מעבר ל"RL Environment as a Service", אנו מציעים סביבת Real-to-Sim-to-Real וענן הערכה. הסביבה לא מיועדת רק להפעלת RL - היא מיועדת לנתונים סינתטיים, אימון מדיניות, הערכה מדומה, שידור חוזר של כישלונות ופרסום בנצ'מרק. מודל עולמי, יצירת סביבה והערכה מאוחדים.
המצב האידיאלי: לקוחות מעלים יומני כשל אמיתיים → אנו יוצרים אוטומטית הפעלה חוזרת ומשוואה → כל שינויי המדיניות עוברים תחילה דרך המערכת שלנו → לקוחות בודקים את דו"ח הרגרסיה שלנו מדי לילה → יותר רובוטים ומשימות על הסיפון לאורך זמן.
זה כשאנחנו לא "צוות שמשתמש בבינה מלאכותית" - אנחנו מישור בקרה כברירת מחדל עבור איטרציה של רובוטים בעולם האמיתי של לקוחות.