Pourquoi la collecte de données bimanuelle est plus difficile
Dans la collecte de données sur un seul bras, une mauvaise démonstration n'affecte que la trajectoire d'un seul bras. Vous enregistrez 50 démos, supprimez 5 mauvaises et entraînez-vous sur 45. Dans la collecte de données bimanuelle, une erreur au point de transfert invalide les deux trajectoires des armes pour cette démo simultanément. Les modes de défaillance sont couplés.
Ce couplage a deux implications pratiques. Premièrement, vous avez besoin de plus de démonstrations – 100 au lieu de 50 – car les tâches bimanuelles ont une variance plus élevée et la politique a besoin de plus d'exemples pour apprendre la structure de coordination. Deuxièmement, vous avez besoin d’une cohérence plus stricte par démonstration. Une démo à un seul bras cohérente à 80 % s’entraîne assez bien. Une démonstration bimanuelle où un bras est cohérent et l’autre varie n’enseigne rien d’utile à la politique sur le timing de coordination.
Le défi de la couverture de l'espace de travail est également plus grand : vous devez avoir les deux bras dans le cadre, et le point de transfert (le moment le plus complexe) doit être capturé de manière fiable par au moins une caméra. Vérifiez les angles de votre caméra avant de commencer et ajustez si le transfert se produit en dehors du champ de vision de la caméra de l'espace de travail.
Format de jeu de données bimanuel LeRobot
L'intégration du DK1 avec LeRobot étend le format standard à un seul bras avec des réseaux à deux états articulés. Chaque pas de temps de l'ensemble de données contient :
La principale différence avec un seul bras : l'espace d'action est à 14 dimensions (6+6 articulations + 2 pinces). ACT gère cela de manière native : vous spécifiez la dimension de l'action dans la configuration de la formation et aucune autre modification n'est requise.
Flux de travail d'enregistrement
Exécutez 10 à 15 démonstrations pratiques avant de commencer la session d'enregistrement pour réchauffer votre mémoire motrice pour la tâche. Les 5 à 10 premières démos enregistrées seront vos pires – c'est normal. Ne vous arrêtez pas pour les revoir pendant la séance ; révisez et éliminez les mauvaises démos une fois que les 100 complètes ont été enregistrées.
Liste de contrôle de qualité pour les données bimanuelles
Passez en revue chaque démo après l'enregistrement à l'aide de la visionneuse de relecture de LeRobot. Jetez toute démo qui ne répond pas à deux ou plusieurs de ces critères :
Unité 4 terminée quand...
Vous disposez de 100 démonstrations enregistrées au format LeRobot sur ~/dk1-datasets/cube-handoff-v1/. Après examen et sélection, au moins 90 démos satisfont à la liste de contrôle de qualité. Les deux réseaux d’états communs sont présents à 50 Hz pour chaque épisode. Les deux flux de caméra sont présents et affichent la séquence complète des tâches, y compris le moment du transfert. Tu as couru python -m lerobot.scripts.visualize_dataset --repo-id cube-handoff-v1 et confirmé que la structure de l'ensemble de données est valide.