Definition

DAgger (Dataset Aggregation) befasst sich mit dem Verteilungsverschiebungsproblem beim Verhaltensklonen. Im Standard-BC sieht der Lernende nur Zustände aus der Expertenverteilung, aber während der Bereitstellung stößt er aufgrund seiner eigenen unvollkommenen Aktionen auf neuartige Zustände. DAgger führt iterativ die aktuelle Richtlinie aus, sammelt neue Zustände, bittet den Experten, sie mit den richtigen Aktionen zu kennzeichnen, und führt eine Neuschulung durch. Dies deckt nach und nach die Staaten ab, die der Lernende tatsächlich besucht. Zu den Varianten gehören SafeDAgger (mit Sicherheitsbeschränkungen) und HG-DAgger (mit von Menschen gesteuerten Eingriffen).

Warum es für Roboterteams wichtig ist

Das Verständnis von Dolch ist für Teams, die reale Robotersysteme entwickeln, von entscheidender Bedeutung. Unabhängig davon, ob Sie Demonstrationsdaten sammeln, Richtlinien in der Simulation schulen oder in der Produktion einsetzen, wirkt sich dieses Konzept direkt auf Ihren Arbeitsablauf und Ihr Systemdesign aus.