Los puntos clave no están disponibles para este artículo en este momento.
Los métodos basados en mapas de activación de clases (CAM) proporcionan un mecanismo simple para interpretar las predicciones de redes neuronales convolucionales utilizando combinaciones lineales de mapas de características como mapas de saliencia. En contraste, los métodos basados en enmascaramiento optimizan un mapa de saliencia directamente en el espacio de imagen o lo aprenden entrenando otra red con datos adicionales. En este trabajo introducimos Opti-CAM, combinando ideas de enfoques basados en CAM y enmascaramiento. Nuestro mapa de saliencia es una combinación lineal de mapas de características, donde los pesos se optimizan por imagen de tal manera que el logit de la imagen enmascarada para una clase dada se maximiza. También corregimos un defecto fundamental en dos de las métricas de evaluación más comunes de los métodos de atribución. En varios conjuntos de datos, Opti-CAM supera ampliamente a otros enfoques basados en CAM según las métricas de clasificación más relevantes. Proporcionamos evidencia empírica que apoya que la localización y la interpretabilidad del clasificador no están necesariamente alineadas.
Zhang et al. (Thu,) estudiaron esta pregunta.