Key points are not available for this paper at this time.
A crescente complexidade dos modelos de aprendizado profundo pode dificultar a interpretação e o ajuste de modelos além de uma avaliação puramente focada na acurácia. É aqui que a inteligência artificial interpretável e explicável (XAI) entra em cena para facilitar a compreensão dos mecanismos internos dos modelos. Consequentemente, alternativas surgiram, como as técnicas de mapeamento de ativação de classe (CAM) que visam identificar regiões de importância para um modelo de classificação de imagens. No entanto, o comportamento de tais modelos pode depender fortemente do tipo de arquitetura e das diferentes variantes de redes neurais convolucionais. Assim, este artigo avalia três arquiteturas de Rede Neural Convolucional (CNN) (VGG16, ResNet50, ConvNext-T) em relação a sete modelos CAM (GradCAM, XGradCAM, HiResCAM, LayerCAM, GradCAM++, GradCAMElementWise e EigenCAM), indicando que os mapas CAM obtidos com os modelos ConvNext mostram menos variabilidade entre eles, ou seja, são menos dependentes da abordagem CAM selecionada. Este estudo foi realizado em um conjunto de dados de imagens para a classificação da ferrugem das folhas do café e avaliado usando a métrica RemOve And Debias (ROAD).
Chavarro et al. (Ter,) estudaram esta questão.