What question did this study set out to answer?

L'objectif est de développer une méthode efficace pour générer des rapports de pathologie diagnostique directement à partir d'images de diapositives entières.

December 19, 2025Open Access

MPath : génération de rapports de pathologie multimodaux à partir d'images de diapositives entières

Key Points

L'objectif est de développer une méthode efficace pour générer des rapports de pathologie diagnostique directement à partir d'images de diapositives entières.
Introduit MPath, un cadre multimodal combinant des embeddings visuels et un modèle de langage.
Conditionné BioBART sur des embeddings visuels dérivés des WSI avec sollicitation de préfixe visuel.
Développé et évalué la méthode sur le jeu de données RED 2025 Grand Challenge.
Classé 4ème dans la phase de test 2 du RED 2025 Grand Challenge.
La condition multimodale basée sur des invites montre un potentiel pour la génération évolutive de rapports de pathologie.

Abstract

La génération automatisée de rapports de pathologie diagnostique directement à partir d'images de diapositives entières (WSI) est une direction émergente en pathologie computationnelle. Traduire des motifs tissulaires haute résolution en texte cliniquement cohérent reste difficile en raison de la grande variabilité morphologique et de la structure complexe des récits pathologiques. Nous introduisons MPath, un cadre multimodal léger qui conditionne un modèle de langage biomédical préentraîné (BioBART) sur des embeddings visuels dérivés des WSI à travers un mécanisme de sollicitation de préfixe visuel appris. Au lieu d'un préentraînement vision-langage de bout en bout, MPath utilise les caractéristiques de modèle fondamental des WSI (CONCH + Titan) et les injecte dans BioBART via un module de projection compact, gardant l'architecture linguistique figée pour la stabilité et l'efficacité des données. MPath a été développé et évalué sur le jeu de données RED 2025 Grand Challenge et a été classé 4ème dans la phase de test 2, malgré des opportunités de soumission limitées. Les résultats mettent en évidence le potentiel de la condition multimodale basée sur des invites comme une stratégie évolutive et interprétable pour la génération de rapports de pathologie.

Read Full Paperexternally

Demander à l'IA

Bookmark

View Full Paper