June 12, 2016Open Access

InfoGAN: Aprendizaje de Representaciones Interpretable mediante Redes Generativas Antagónicas que Maximizan la Información

Puntos clave

Los puntos clave no están disponibles para este artículo en este momento.

Resumen

Este artículo describe InfoGAN, una extensión de teoría de la información a la Red Generativa Antagónica que es capaz de aprender representaciones desenlazadas de manera completamente no supervisada. InfoGAN es una red generativa antagónica que también maximiza la información mutua entre un pequeño subconjunto de las variables latentes y la observación. Derivamos un límite inferior para el objetivo de información mutua que puede ser optimizado de manera eficiente y mostramos que nuestro procedimiento de entrenamiento puede interpretarse como una variación del algoritmo Wake-Sleep. Específicamente, InfoGAN desenlaza con éxito los estilos de escritura de las formas de los dígitos en el conjunto de datos MNIST, la pose de la iluminación de imágenes renderizadas en 3D, y los dígitos de fondo del dígito central en el conjunto de datos SVHN. También descubre conceptos visuales que incluyen estilos de cabello, presencia/ausencia de gafas, y emociones en el conjunto de datos CelebA. Los experimentos muestran que InfoGAN aprende representaciones interpretables que son competitivas con las representaciones aprendidas por métodos completamente supervisados existentes.

Me gusta

Guardar

Ver artículo completo