Key points are not available for this paper at this time.
Nous présentons un nouveau modèle entraîné sur des multimodalités d'images de Tomographie par Émission de Positrons (PET-AV45 et PET-FDG) pour le diagnostic de la maladie d'Alzheimer (MA). Contrairement aux méthodes conventionnelles utilisant une architecture CNN 3D/2D multimodale, notre conception remplace le Réseau de Neurones Convolutifs (CNN) par un Transformateur de Vision (ViT). Compte tenu du coût de calcul élevé des images 3D, nous employons d'abord une opération de conversion 3D en 2D pour projeter les images PET 3D dans des images de fusion 2D. Ensuite, nous transmettons les images 2D multimodales fusionnées à un modèle ViT parallèle pour l'extraction de caractéristiques, suivie d'une classification pour le diagnostic de la MA. Pour l'évaluation, nous utilisons des images PET provenant d'ADNI. Le modèle proposé surpasse plusieurs modèles de référence solides lors de nos expériences et atteint une précision de 0,91 et un AUC de 0,95.
Xing et al. (Mon,) ont étudié cette question.