- Política de DifusiónFuerte para datos de demostración de alta calidad y modelado de trayectorias.
- ACT / LeRobotÚtil para bucles de aprendizaje por imitación prácticos.
- VLAs más pequeñosÚtil cuando los datos de teleoperación son parte de una pila más amplia condicionada por el lenguaje.
Modelos para iniciar la teleoperación.
Los equipos que priorizan la teleoperación generalmente necesitan modelos que aprendan rápido de las demostraciones, preserven el sesgo del operador de manera productiva y expongan claramente los puntos de fallo.
Si necesitas victorias rápidas de un conjunto de datos de teleoperación enfocado, las políticas de imitación específicas de la tarea a menudo superan a los grandes modelos generales en tiempo de valor.