Definición

La política de difusión aplica modelos probabilísticos de difusión de denoising (DDPM) a la generación de acciones. En lugar de predecir una sola acción, el modelo denoise iterativamente una muestra aleatoria en una trayectoria de acción. Esto permite capturar distribuciones multimodales sobre comportamientos posibles, lo cual es crítico para la manipulación rica en contacto donde existen múltiples estrategias válidas. La política de difusión ha mostrado resultados sólidos en tareas bimanuales, uso de herramientas y plegado de telas. Normalmente opera en fragmentos de acción (secuencias de 8 a 32 acciones futuras) en lugar de predicciones de un solo paso.

Por qué es importante para los equipos de robots

Entender la política de difusión es esencial para los equipos que construyen sistemas robóticos en el mundo real. Ya sea que estés recolectando datos de demostración, entrenando políticas en simulación o desplegando en producción, este concepto afecta directamente tu flujo de trabajo y diseño del sistema.