Los modelos de difusión han alcanzado un rendimiento de vanguardia, demostrando notables capacidades de generalización en diversos dominios. Sin embargo, los mecanismos que sustentan estas fuertes capacidades siguen siendo solo parcialmente comprendidos. Una conjetura principal, basada en la hipótesis de la variedad, atribuye este éxito a su capacidad de adaptarse a la estructura geométrica de baja dimensión dentro de los datos. Este trabajo proporciona evidencia para esta conjetura, centrándose en cómo tales fenómenos podrían resultar de la formulación del problema de aprendizaje a través de la coincidencia de puntuaciones. Inspeccionamos el papel de la regularización implícita al investigar el efecto del suavizado de los minimizadores del objetivo de coincidencia de puntuaciones empíricas. Nuestros resultados teóricos y empíricos confirman que suavizar la función de puntuación —o, de manera equivalente, suavizar en el dominio de log-densidad— produce un suavizado tangencial a la variedad de datos. Además, mostramos que la variedad a lo largo de la cual el modelo de difusión generaliza puede ser controlada eligiendo un suavizado apropiado.
Farghly et al. (Jue,) estudiaron esta cuestión.