Los puntos clave no están disponibles para este artículo en este momento.
La síntesis de imágenes fotorealistas de alta resolución ha sido un desafío durante mucho tiempo en el aprendizaje automático. En este artículo introducimos nuevos métodos para la mejor entrenamiento de redes generativas antagónicas (GANs) para la síntesis de imágenes. Construimos una variante de GANs que emplea un condicionamiento de etiquetas que resulta en muestras de imágenes de resolución 128x128 que exhiben coherencia global. Ampliamos trabajos anteriores sobre evaluación de calidad de imagen para proporcionar dos nuevos análisis para evaluar la discriminación y diversidad de muestras de modelos de síntesis de imágenes condicionales a la clase. Estos análisis demuestran que las muestras de alta resolución proporcionan información de clase que no está presente en muestras de baja resolución. A través de 1000 clases de ImageNet, las muestras de 128x128 son más del doble de discriminables que las muestras redimensionadas artificialmente a 32x32. Además, el 84.7% de las clases tienen muestras que exhiben diversidad comparable a los datos reales de ImageNet.
Odena et al. (Sun,) estudiaron esta cuestión.