Key points are not available for this paper at this time.
O sucesso das recentes redes neurais convolucionais profundas (CNNs) depende do aprendizado de representações ocultas que podem resumir os fatores importantes de variação por trás dos dados. Neste trabalho, descrevemos a Dissecção de Rede, um método que interpreta redes fornecendo rótulos significativos para suas unidades individuais. O método proposto quantifica a interpretabilidade das representações das CNNs avaliando o alinhamento entre unidades ocultas individuais e conceitos semânticos visuais. Ao identificar os melhores alinhamentos, as unidades recebem rótulos interpretáveis que variam de cores, materiais, texturas, partes, objetos e cenas. O método revela que representações profundas são mais transparentes e interpretáveis do que seriam sob uma base aleatória igualmente poderosa. Aplicamos nossa abordagem para interpretar e comparar as representações latentes de várias arquiteturas de rede treinadas para resolver uma ampla gama de tarefas supervisionadas e auto-supervisionadas. Em seguida, examinamos fatores que afetam a interpretabilidade da rede, como o número de iterações de treinamento, regularizações, diferentes parâmetros de inicialização, bem como a profundidade e largura das redes. Finalmente, mostramos que as unidades interpretadas podem ser usadas para fornecer explicações explícitas de uma determinada previsão de CNN para uma imagem. Nossos resultados destacam que a interpretabilidade é uma propriedade importante das redes neurais profundas que fornece novas perspectivas sobre o que estruturas hierárquicas podem aprender.
Zhou et al. (Mon,) estudaram esta questão.