Verbinden Sie Ihren Roboter oder öffnen Sie die Simulation
Wenn Sie einen echten Roboter verwenden, schließen Sie ihn jetzt an und vergewissern Sie sich, dass er von Ihrem System erkannt wird, bevor Sie den Aufnahmebefehl ausführen. Wenn Sie in der Simulation arbeiten, kann der Befehl „Aufzeichnen“ einen virtuellen Roboter steuern gym_pusht oder gym_aloha Umgebungen, die eine Tastatur oder eine Skriptrichtlinie als Teleoperationsquelle verwenden.
In der Terminalausgabe sollten Gelenkzustände gestreamt werden und (bei echten Robotern) der Arm auf Eingaben reagieren. Wenn nicht, beheben Sie das Verbindungsproblem, bevor Sie fortfahren – die Aufnahme mit einem nicht verbundenen Roboter führt stillschweigend zu beschädigten Daten.
Der Record-Befehl
Der zentrale Aufnahmebefehl. Passen Sie die Flags an Ihr Setup an:
--robot-path mit deiner Sim-Konfiguration. Hinzufügen --env-name gym_pusht/PushT-v0 Und --policy-path lerobot/act_pusht_keypoints um geskriptete (nicht menschliche) Demonstrationen für einen Basisdatensatz aufzuzeichnen.
Wie viele Demonstrationen?
Die richtige Anzahl hängt von Ihrem Setup ab:
- Simulation: 50 geskriptete Episoden reichen für eine Basisrichtlinie aus. Die Umgebung ist deterministisch, daher ist die Varianz gering und 50 reicht aus, damit ACT konvergiert.
- Echter Roboter, einfache Aufgabe: 50–80 menschliche Demonstrationen. Ein Pick-and-Place mit einer festen Objektposition kann am unteren Ende dieses Bereichs gut trainieren, wenn Ihre Demos konsistent sind.
- Echter Roboter, variable Aufgabe: 100–200 Demonstrationen. Wenn die Objektpositionen variieren oder die Aufgabe mehrere Teilschritte erfordert, benötigen Sie mehr Abdeckung.
Für diesen Pfad, Ziel Mindestens 50 Vorführungen. Qualität schlägt Quantität – 50 konsistente Demonstrationen übertreffen jedes Mal 150 schlampige.
Gute Demonstrationspraktiken
Konsistente Arbeitsplatzeinrichtung
Setzen Sie Objekte vor jeder Episode auf die gleiche Position zurück. Markieren Sie die Startpositionen mit Klebeband auf dem Tisch. Die Richtlinie lernt aus der Verteilung der Positionen in Ihren Demos – wenn sich alle an derselben Stelle befinden, wird die Richtlinie für diese Stelle kalibriert.
Vollständige Episoden
Jede Episode sollte mit der gleichen Ausgangsposition beginnen und mit der vollständigen Erledigung der Aufgabe enden. Hören Sie nicht mitten in der Aufgabe mit der Aufzeichnung auf. Eine unvollständige Episode, in der sich der Greifer in der Mitte eines Griffs befindet, lehrt das Modell ein gebrochenes Verhalten.
Bewusste, sanfte Bewegungen
Bewegen Sie sich mit 40–60 % der Höchstgeschwindigkeit. Langsam genug, um flüssig zu sein, schnell genug, um nicht nervös zu sein. Das Modell lernt das Timing aus Ihren Demonstrationen – unregelmäßige Geschwindigkeit führt zu unregelmäßigen Richtlinien.
Teilweise oder abgebrochene Demos
Wenn Sie das Objekt fallen lassen, mit dem Arbeitsbereich kollidieren oder einen Fehler auslösen, drücken Sie Ctrl+C um die Episode abzubrechen. Die Folge wird verworfen. Pushen Sie niemals eine abgebrochene Episode – das vergiftet den Datensatz.
Inkonsistente Strategie
Mischen Sie keine Strategien: Greifen Sie in einigen Demos nicht von links und in anderen nicht von rechts. Wählen Sie einen Ansatz und verwenden Sie ihn für jede Episode. Der CVAE von ACT lernt einen einzigen „Stil“ – Inkonsistenz zwingt ihn zur Mittelung, wodurch keine der beiden Strategien zuverlässig erzeugt wird.
Drücken Sie auf HuggingFace Hub
Wenn Sie es nicht eingestellt haben --dataset.push-to-hub 1 Während der Aufnahme manuell nach der Sitzung drücken:
--private 1 zum Push-Befehl. Öffentliche Datensätze tragen zur Robotik-Community bei und können in der vorgestellt werden SVRC-Datensatzbibliothek.
Einheit 3 abgeschlossen, wenn...
Sie haben mindestens 50 vollständige, nicht abgebrochene Demonstrationen in einem LeRobot-Datensatz auf HuggingFace Hub. Sie können Ihren Datensatz mit laden LeRobotDataset("your-username/pick-place-v1") und sehen Sie sich die erwartete Anzahl der Folgen an. Sie haben mindestens 5 Ihrer eigenen Episoden mit visualisiert lerobot.scripts.visualize_dataset und bestätigt, dass die Gelenkbahnen glatt aussehen und die Greiferzustandsänderungen sauber sind. Sie sind bereit, in Einheit 4 zu trainieren.