Resumo Redes Neurais Gráficas (GNNs) tornaram-se o modelo de aprendizado profundo dominante para aprendizagem em dados estruturados em grafos, possibilitando avanços em áreas que vão desde bioinformática até análise de redes sociais. No entanto, como qualquer modelo de aprendizado profundo, elas sofrem da síndrome da caixa preta. O processo de tomada de decisão permanece amplamente desconhecido. Neste trabalho, queremos avançar nossa compreensão da explicabilidade das GNNs. Avaliamos o desempenho e a estabilidade do GNNExplainer, um método de interpretabilidade pós-hoc amplamente utilizado, na simples tarefa de classificação de grafos aleatórios. Usando três arquiteturas GNN muito diferentes, Redes Neurais Convolucionais Gráficas, Redes Neurais de Atenção Gráfica e Redes de Isomorfismo Gráfico, examinamos a explicabilidade de modelos treinados para distinguir entre grafos aleatórios Erds-Rnyi e Barabsi-Albert, bem como entre variantes dk-randomizadas de quatro redes do mundo real. Nossos resultados mostram que, apesar dos modelos alcançarem precisão de classificação perfeita, os valores de importância das características identificados pelo GNNExplainer exibem uma variabilidade substancial entre arquiteturas, hiperparâmetros e valores de sementes aleatórias. Além disso, as explicações extraídas frequentemente falham em alinhar-se às expectativas teóricas baseadas em propriedades de grafos estabelecidas, como distribuições de grau e correlações de grau. Essas descobertas indicam que as explicações produzidas pelo GNNExplainer são altamente dependentes do modelo, configuração e valor de semente, desafiando sua confiabilidade para derivar percepções gerais sobre os mecanismos de decisão das GNNs. Nosso trabalho destaca limitações fundamentais na geração atual de explicações das GNNs usando o GNNExplainer e sugere a necessidade de abordagens mais estáveis e teoricamente fundamentadas para a explicabilidade em aprendizagem baseada em grafos.
Cvetković et al. (Terçada) estudaram esta questão.