Définition

L'apprentissage du programme présente les tâches de formation par ordre de difficulté croissante, imitant la façon dont les humains apprennent. En matière de manipulation robotique, un programme peut commencer avec de gros objets faciles à saisir et progresser vers des objets plus petits et glissants. En locomotion, la difficulté du terrain peut passer d'un terrain plat à des pentes et des escaliers inégaux. Les méthodes pédagogiques automatiques (telles que les cadres PAIRED, PLR et enseignant-élève) ajustent dynamiquement la difficulté en fonction de la compétence actuelle de l'apprenant. L'apprentissage par le programme réduit le besoin de façonner les récompenses et peut améliorer considérablement l'efficacité des échantillons dans la simulation et dans la formation réelle.

Pourquoi c'est important pour les équipes de robots

Comprendre l'apprentissage du programme est essentiel pour les équipes qui construisent des systèmes robotiques du monde réel. Que vous collectiez des données de démonstration, formiez des politiques en simulation ou déployiez en production, ce concept affecte directement votre flux de travail et la conception de votre système.