Los puntos clave no están disponibles para este artículo en este momento.
Este artículo describe InfoGAN, una extensión de teoría de la información a la Red Generativa Antagónica que es capaz de aprender representaciones desenlazadas de manera completamente no supervisada. InfoGAN es una red generativa antagónica que también maximiza la información mutua entre un pequeño subconjunto de las variables latentes y la observación. Derivamos un límite inferior para el objetivo de información mutua que puede ser optimizado de manera eficiente y mostramos que nuestro procedimiento de entrenamiento puede interpretarse como una variación del algoritmo Wake-Sleep. Específicamente, InfoGAN desenlaza con éxito los estilos de escritura de las formas de los dígitos en el conjunto de datos MNIST, la pose de la iluminación de imágenes renderizadas en 3D, y los dígitos de fondo del dígito central en el conjunto de datos SVHN. También descubre conceptos visuales que incluyen estilos de cabello, presencia/ausencia de gafas, y emociones en el conjunto de datos CelebA. Los experimentos muestran que InfoGAN aprende representaciones interpretables que son competitivas con las representaciones aprendidas por métodos completamente supervisados existentes.
Chen et al. (Sun,) estudiaron esta cuestión.