October 1, 2017

Detección de Ejemplos Adversariales en Redes Profundas con Estadísticas de Filtros Convolucionales

Puntos clave

Los puntos clave no están disponibles para este artículo en este momento.

Resumen

El aprendizaje profundo ha mejorado mucho el reconocimiento visual en los últimos años. Sin embargo, investigaciones recientes han mostrado que existen muchos ejemplos adversariales que pueden afectar negativamente el rendimiento de tal arquitectura. Este artículo se centra en detectar esos ejemplos adversariales analizando si provienen de la misma distribución que los ejemplos normales. En lugar de entrenar directamente una red neuronal profunda para detectar adversariales, se propuso un enfoque mucho más simple basado en estadísticas de las salidas de las capas convolucionales. Se diseñó un clasificador en cascada para detectar adversariales de manera eficiente. Además, entrenado desde un mecanismo generador adversarial particular, el clasificador resultante puede detectar con éxito adversariales de un mecanismo completamente diferente también. El clasificador resultante es no subdiferenciable, lo que crea una dificultad para que los adversarios ataquen utilizando el gradiente del clasificador. Después de detectar ejemplos adversariales, mostramos que muchos de ellos pueden recuperarse simplemente realizando un pequeño filtro de promedio en la imagen. Estos hallazgos deberían llevar a más conocimientos sobre los mecanismos de clasificación en redes neuronales convolucionales profundas.

Me gusta

Guardar

Me gusta

Guardar

Detección de Ejemplos Adversariales en Redes Profundas con Estadísticas de Filtros Convolucionales

Puntos clave

Resumen

Cite This Study