What question did this study set out to answer?

Examiner si l'intégration des connaissances médicales peut améliorer les modèles de prédiction diagnostique de l'IA et soutenir le raisonnement clinique.

March 7, 2026

Relier l'apprentissage préliminaire informé par le laboratoire et l'apprentissage guidé par la connaissance pour le raisonnement diagnostique

Key Points

Examiner si l'intégration des connaissances médicales peut améliorer les modèles de prédiction diagnostique de l'IA et soutenir le raisonnement clinique.
Cadre DuaLK développé combinant des graphes de connaissances et des tâches informées par le laboratoire.
Graphe de connaissances sur le diagnostic construit en utilisant des relations hiérarchiques et sémantiques.
Alignement des données cliniques avec un processus de raisonnement structuré par étapes basé sur les signaux des tests de laboratoire.
Évalué DuaLK par rapport aux modèles existants en utilisant deux ensembles de données DSE publics sur quatre tâches de prédiction clinique.
DuaLK a considérablement surpassé les modèles de base existants dans tous les tests.
La combinaison de connaissances médicales structurées et de signaux cliniques a conduit à une meilleure précision prédictive.
Les résultats suggèrent une meilleure interprétabilité des prédictions diagnostiques.

Abstract

Malgré l'utilisation croissante des dossiers de santé électroniques (DSE) pour la prédiction de diagnostics assistée par l'IA, la plupart des modèles basés sur les données ont du mal à incorporer des connaissances médicales cliniquement significatives. Ils reposent souvent sur des ontologies limitées, manquant de capacités de raisonnement structuré et de couverture complète. Cela soulève une question de recherche importante : les connaissances médicales amélioreront-elles les modèles prédictifs pour soutenir le raisonnement clinique par étapes tel que pratiqué par les médecins humains ? Pour répondre à ce problème, nous proposons DuaLK, un cadre à double expertise qui combine deux sources d'information complémentaires. Pour les connaissances externes, nous construisons un graphe de connaissances sur les diagnostics (KG) qui encode à la fois des relations hiérarchiques et sémantiques enrichies par de grands modèles de langage (LLM). Pour s'aligner avec les données du patient, nous introduisons également une tâche proxy informée par le laboratoire qui guide le modèle à suivre un processus de raisonnement clinique cohérent et par étapes basé sur les signaux des tests de laboratoire. Les résultats expérimentaux sur deux ensembles de données DSE publics démontrent que DuaLK surpasse systématiquement les bases de référence existantes dans quatre tâches de prédiction clinique. Ces résultats mettent en évidence le potentiel de la combinaison de connaissances médicales structurées avec des signaux cliniques à niveau individuel pour réaliser des prédictions diagnostiques plus précises et interprétables. Le code source est disponible publiquement sur https://github.com/humphreyhuu/DuaLK.

Bookmark

Relier l'apprentissage préliminaire informé par le laboratoire et l'apprentissage guidé par la connaissance pour le raisonnement diagnostique

Key Points

Abstract

Cite This Study