Definition
Die Diffusionspolitik wendet auf die Aktionsgenerierung entrauschende Diffusions-Probabilistikmodelle (DDPMs) an. Anstatt eine einzelne Aktion vorherzusagen, entrauscht das Modell iterativ eine Zufallsstichprobe in einen Aktionsverlauf. Dies ermöglicht die Erfassung multimodaler Verteilungen möglicher Verhaltensweisen – entscheidend für kontaktreiche Manipulationen, bei denen mehrere gültige Strategien vorhanden sind. Diffusion Policy hat gute Ergebnisse bei bimanuellen Aufgaben, der Verwendung von Werkzeugen und dem Falten von Stoffen gezeigt. Typischerweise arbeitet es mit Aktionsblöcken (Sequenzen von 8–32 zukünftigen Aktionen) und nicht mit Einzelschrittvorhersagen.
Warum es für Roboterteams wichtig ist
Das Verständnis der Diffusionspolitik ist für Teams, die reale Robotersysteme entwickeln, von entscheidender Bedeutung. Unabhängig davon, ob Sie Demonstrationsdaten sammeln, Richtlinien in der Simulation schulen oder in der Produktion einsetzen, wirkt sich dieses Konzept direkt auf Ihren Arbeitsablauf und Ihr Systemdesign aus.