Les maladies oculaires, y compris la rétinopathie diabétique (DR), le glaucome et les cataractes, représentent une préoccupation majeure pour la santé mondiale et peuvent entraîner une déficience visuelle sévère ou la cécité si elles ne sont pas identifiées en temps opportun. Cette étude propose un cadre novateur de classification des maladies oculaires basé sur un transformateur de vision multi-axes (MaxViT) appliqué à des images du fond d'œil en couleur avec des techniques d'intelligence artificielle explicable (XAI) pour améliorer la transparence du modèle. L'architecture proposée intègre des mécanismes d'attention basés sur les transformateurs avec des couches de perceptrons multicouches (MLP) basées sur la normalisation de réponse globale (GRN) pour capturer efficacement des relations spatiales et contextuelles complexes au sein des images du fond d'œil. Le modèle a été évalué sur un ensemble de données de classification des maladies oculaires disponible publiquement en utilisant une stratégie de validation croisée en cinq volets pour évaluer sa robustesse et sa généralisation. Les résultats expérimentaux montrent que l'approche proposée surpasse constamment les réseaux de neurones convolutionnels (CNN) conventionnels et les variantes de transformateur de vision (ViT), y compris ResNet50, Swin-T, MaxViT-T et ViT-B16. Le modèle a atteint des valeurs de précision, de rappel et d'exactitude test macro-moyennées de 96,75 %, 96,70 % et 96,80 %, respectivement, les tests statistiques appariés confirmant que ces améliorations étaient significativement significatives. Des techniques de prétraitement rigoureuses ont été employées pour améliorer la cohérence des données, et des explications visuelles basées sur XAI ont fourni des aperçus du processus de décision du modèle, soutenant l'interprétabilité dans l'analyse des images ophthalmiques. Dans l'ensemble, le cadre basé sur MaxViT proposé est robuste et réalisable sur le plan computationnel pour des approches d'évaluation orientées recherche pour la classification automatisée des images du fond d'œil, soulignant le potentiel des architectures avancées de transformateurs pour les futures applications de soutien à la décision et de recherche en ophtalmologie.
Building similarity graph...
Analyzing shared references across papers
Loading...
Md Mehedi Hasan Santo
Fuyad Hasan Bhoyan
University of Liberal Arts Bangladesh
Fuad Ibne Jashim Farhad
Queensland University of Technology
PLoS ONE
Building similarity graph...
Analyzing shared references across papers
Loading...
Santo et al. (Mercredi,) ont étudié cette question.
synapsesocial.com/papers/69d896406c1944d70ce0790d — DOI: https://doi.org/10.1371/journal.pone.0346329
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: