Mobile ALOHA-Setup-Anleitung: Hardware, Software und erste Demo
Mobile ALOHA ist eine der einflussreichsten bimanuellen Manipulationsplattformen, die in der akademischen Forschung entstanden sind. Um es durchgängig zum Laufen zu bringen – Hardware zusammengebaut, Arme kalibriert, Software-Stack live und erste Demonstration aufgezeichnet – ist sorgfältige Aufmerksamkeit für jede Schicht des Systems erforderlich.
Übersicht über die Hardware-Montage
Ein mobiles ALOHA-System besteht aus einer mobilen Basis mit Rädern (typischerweise ein AgileX Tracer oder eine gleichwertige Differentialantriebsplattform) mit zwei ViperX 300 oder ähnlichen 6-DOF-Armen, die auf einem erhöhten Chassis montiert sind. Für den bimanuellen Aufbau sind passende Führungs- und Folgearmepaare erforderlich: Die Führungsarme sind leichter, rückwärts fahrbar und werden während der Teleoperation vom menschlichen Bediener gehalten. Follower-Arme sind die Roboterarme, die die Bewegungen des Leaders in Echtzeit widerspiegeln.
Die Montage beginnt mit der Montage der Folgearme am Fahrgestell in der richtigen Höhe und dem richtigen seitlichen Versatz, um der Ergonomie des Führungsarms zu entsprechen. Eine Nichtübereinstimmung zwischen Führungs- und Folgegeometrie ist eine häufige Ursache für Qualitätsprobleme bei der Steuerung. Der Kamerastapel – normalerweise eine am Handgelenk montierte Kamera an jedem Folgearm sowie eine oder zwei Overhead-Kameras – sollte installiert und gesichert werden, bevor mit der Softwarekalibrierung begonnen wird. Das Kabelmanagement ist wichtiger als es aussieht: Lose Kabel unterbrechen Episoden und erzeugen fehlerhafte Daten.
Leader-Follower-Kalibrierung
Die Kalibrierung ist der Schritt, den die meisten Teams überstürzen und den die meisten Teams bereuen. Bevor Sie eine einzelne Episode aufzeichnen, müssen sich die Führungs- und Folgearme in übereinstimmenden Gelenk-Null-Positionen befinden. Die meisten ViperX-basierten Setups werden mit physischen Kalibrierungsvorrichtungen geliefert – verwenden Sie diese. Nach der mechanischen Nullstellung erfasst die Softwarekalibrierung den Gelenkversatz zwischen Vor- und Nachlauf in der Nullstellung und speichert ihn als Bias-Korrektur, die in Echtzeit während der Teleoperation angewendet wird.
Testen Sie die Qualität der Kalibrierung, indem Sie die Führungsarme langsam durch ihren Arbeitsbereich führen und die Spur der Folgearme beobachten. Jede anhaltende Gelenkspaltverzögerung, Abweichung bei bestimmten Gelenkwinkeln oder eine asymmetrische Reaktion zwischen links und rechts weist auf einen Kalibrierungsfehler hin, der Ihren Datensatz beeinträchtigt. Führen Sie eine Neukalibrierung durch, bevor Sie mit einer Datenerfassungskampagne beginnen, und überprüfen Sie die Kalibrierung erneut, nachdem Sie das System versendet oder mechanische Anpassungen vorgenommen haben.
Software-Stack: ACT und LeRobot
Das ursprüngliche Mobile ALOHA-Papier verwendete die ACT-Richtlinie (Action Chunking with Transformers), die auf Demonstrationsdaten trainiert wurde. Der Software-Stack besteht aus drei Schichten: einer Low-Level-Steuerungsschicht, die auf dem eingebetteten Computer des Roboters läuft, einer Teleoperationsaufzeichnungsschicht, die Gelenkzustände und Kamerabilder synchron erfasst, und einer Trainingsschicht, in der ACT oder eine andere Richtlinie anhand des gesammelten Datensatzes trainiert wird.
LeRobot von Hugging Face ist zum Standard-Open-Source-Framework für diesen Workflow geworden. Es bietet ein einheitliches Datenformat, Aufzeichnungsskripte für Hardware im ALOHA-Stil und Trainingspipelines für ACT, Diffusion Policy und TDMPC. SVRCs Datenplattform exportiert Datensätze in einem LeRobot-kompatiblen Format, sodass Sie ganz einfach mit SVRC-erfassten Daten trainieren oder Ihre eigenen Demonstrationen zur Speicherung und Versionierung hochladen können.
Aufzeichnen Ihrer ersten Datenerfassungssitzung
Definieren Sie vor der Aufnahme die Aufgabe genau. „Hebe den Becher auf“ ist zu vage – geben Sie den Startort, die Ausrichtung und die Zielposition des Bechers an. Die Konsistenz bei der Aufgabeneinrichtung macht Demonstrationsdatensätze lernbar. Bereiten Sie 3–5 Reset-Prozeduren vor, um den Arbeitsbereich zwischen den Episoden schnell wieder in den Ausgangszustand zu versetzen.
Streben Sie für eine erste Sitzung 50 erfolgreiche Demonstrationen einer einzelnen, klar definierten Aufgabe an. Nehmen Sie mit 30 Hz oder höher auf. Versehen Sie jede Episode unmittelbar nach der Aufnahme mit einer Erfolgskennzeichnung – bewahren Sie die Anmerkung nicht für später auf. SVRC empfiehlt, bei mindestens zwei unterschiedlichen Lichtverhältnissen und mit geringfügigen Abweichungen bei der Objektplatzierung aufzunehmen, um von Anfang an Abwechslung zu schaffen. Der SVRC-Datendienstplattform bietet Episodenbrowser und Anmerkungstools, um diesen Arbeitsablauf zu optimieren.
Häufige Probleme und wie man sie behebt
Die häufigsten Probleme mit neuen Mobile ALOHA-Setups lassen sich in vier Kategorien einteilen. Erstens: Leader-Follower-Verzögerung: Wird normalerweise durch Netzwerklatenz im Regelkreis verursacht. Stellen Sie sicher, dass sich Leader und Follower auf demselben lokalen Computer befinden oder über eine dedizierte Ethernet-Verbindung und nicht über WLAN verbunden sind. Zweitens: Drift der Kamerasynchronisation: Wenn Handgelenk- und Overhead-Kameras nicht hardwaresynchronisiert sind, verwenden Sie beim Laden der Daten eine zeitstempelbasierte Ausrichtung anstelle einer Frame-Index-Ausrichtung. Drittens Armkollision bei bimanuellen Aufgaben: Fügen Sie vor dem intensiven Training weiche Gelenkgrenzen und Kollisionsnetze im URDF hinzu. Viertens stört die Bewegung der Basis die Armdemonstrationen: Wenn Sie nur Manipulationsdaten erfassen, aktivieren Sie die Basissperre, um ein Abdriften zu verhindern.
Nächste Schritte nach Ihrer ersten Demo
Sobald Sie über einen sauberen Datensatz mit 50 Episoden verfügen, verwenden Sie die LeRobot-Trainingspipeline, um eine ACT-Richtlinie zu trainieren. Erwarten Sie Erfolgsquoten beim ersten Versuch von 40–60 % bei einer klar definierten Aufgabe mit sauberen Daten – das ist normal und verbessert sich schnell mit mehr Demonstrationen und Datenvielfalt. Wenn Sie skalieren, SVRCs Datenerfassungsdienste können Ihren Datensatz mit professionell gesammelten Episoden unter Verwendung standardisierter Hardware erweitern. Für die Beschaffung von Hardware oder zum Leasing eines bimanuellen Systems besuchen Sie unsere Hardware-Katalog oder Kontaktieren Sie das SVRC-Team.