Notre approche
IA physique centrée sur l’humain. Nous nous concentrons sur la boucle de données qui permet à l'apprentissage des robots d'évoluer réellement : il ne s'agit pas de la plus grande plate-forme, mais de celle que les équipes ne peuvent pas remplacer.
La boucle fermée pour laquelle nous optimisons
La boucle de données
Le principal défi de l'apprentissage des robots n'est pas la taille du modèle, mais données. D’où il vient, comment il devient utilisable et comment les différentes sources se combinent. Nous construisons la boucle fermée qui transforme les échecs du monde réel en prochain cycle de formation.
Épisode réel → Paquet structuré → Exécution de référence → Relecture d'échec → Retour à l'entraînement.
Une fois que les clients téléchargent les journaux d'échecs, obtiennent des rapports de relecture et de référence automatiques et exécutent des tests A/B de politique via notre système, ils commencent à en dépendre. C'est les douves.
Ce que nous mesurons
Notre étoile du Nord n'est pas le volume de code ou la taille du modèle. Ce sont ces cinq nombres :
- Temps d’intégration du nouveau robot — À quelle vitesse une nouvelle plateforme peut-elle se connecter ?
- Nouvelle tâche à la première référence — De la démonstration à la politique exécutable
- Temps de recyclage en cas d'échec unique — À quelle vitesse un échec réintègre-t-il le prochain cycle de formation ?
- Couverture d'évaluation automatique — Quel % de décisions reposent sur notre benchmark ?
- Dépendance client hebdomadaire — Combien de décisions d'autorisation ou de non-autorisation transitent par notre système ?
Sources de données que nous unifions
Les données de formation des robots proviennent de cinq chemins principaux. Aucune source unique ne suffit : l'avenir est combinaison de données hétérogènes.
- Vidéo humaine sur Internet — Échelle et priorité, mais pas d'étiquettes d'action. Nous l'utilisons pour la structure des tâches, pas pour les commandes motrices brutes.
- Données synthétiques — Génération automatisée, mais écart Sim2Real. Nous nous concentrons sur la conception des récompenses et la randomisation des domaines.
- Capture de mouvement — Haute précision, portable. Pont entre la vidéo et l'exécution du robot.
- Téléopération robot — Le plus adapté au déploiement, mais cher. Nous optimisons l’efficacité et le flux de correction de type RECAP.
- Combinaison hétérogène — Multi-tâches, multi-robots, multi-modaux. La vraie frontière.
La représentation des données compte plus que le volume brut. Nous transformons les épisodes en paquets structurés, les échecs en cas prêts à être entraînés et les benchmarks en surfaces de décision.
Six douves que nous construisons
- Fossé de données — Pas le plus de données, mais les plus rares : échecs réels, corrections, historique d'évaluation, alignement entre robots.
- Fossé de référence — Les décisions de non-participation des clients dépendent de plus en plus de notre benchmark.
- Fossé adaptateur — La vitesse d'intégration d'un nouveau robot et d'un nouveau périphérique d'entrée constitue le plus grand avantage d'entrée.
- Fossé du flux de travail — La recherche, l'ingénierie, les tests et les opérations voient tous les mêmes faits.
- Fossé de corrélation réel-Sim — Nos résultats de référence prédisent les performances du monde réel.
- Fossé des relations commerciales — De « essayez cet outil » à « nous vérifions votre rapport quotidiennement et prenons des décisions chaque semaine ».
Riche en contacts et tactile
Nous sommes spécialisés dans manipulation riche en contacts — insertion, assemblage, tâches sensibles à la force. De nombreuses équipes font de la vision ; la véritable boucle fermée pour les tâches de contact est plus difficile. Nous intégrons les signaux tactiles, de couple et de force dans la boucle de données et la formation aux politiques.
Environnement d'apprentissage robotique et évaluation en tant que service
Au-delà du « RL Environment as a Service », nous proposons Environnement Real-to-Sim-to-Real et cloud d'évaluation. L'environnement ne sert pas uniquement à exécuter RL : il sert également aux données synthétiques, à la formation aux politiques, à l'évaluation simulée, à la relecture des échecs et à la publication de références. Le modèle mondial, la génération d’environnement et l’évaluation sont unifiés.
L'état idéal : Les clients téléchargent de véritables journaux d'échecs → nous générons automatiquement des replays et des analyses comparatives → tous les changements de politique passent d'abord par notre système → les clients consultent notre rapport de régression tous les soirs → plus de robots et de tâches sont intégrés au fil du temps.
C'est à ce moment-là que nous ne sommes pas « une équipe qui utilise l'IA » : nous sommes le plan de contrôle par défaut pour l'itération robotique du monde réel des clients.
Essayez la plateforme de données sans peur → Inscrivez-vous gratuitement