Malgré l'utilisation croissante des dossiers de santé électroniques (DSE) pour la prédiction de diagnostics assistée par l'IA, la plupart des modèles basés sur les données ont du mal à incorporer des connaissances médicales cliniquement significatives. Ils reposent souvent sur des ontologies limitées, manquant de capacités de raisonnement structuré et de couverture complète. Cela soulève une question de recherche importante : les connaissances médicales amélioreront-elles les modèles prédictifs pour soutenir le raisonnement clinique par étapes tel que pratiqué par les médecins humains ? Pour répondre à ce problème, nous proposons DuaLK, un cadre à double expertise qui combine deux sources d'information complémentaires. Pour les connaissances externes, nous construisons un graphe de connaissances sur les diagnostics (KG) qui encode à la fois des relations hiérarchiques et sémantiques enrichies par de grands modèles de langage (LLM). Pour s'aligner avec les données du patient, nous introduisons également une tâche proxy informée par le laboratoire qui guide le modèle à suivre un processus de raisonnement clinique cohérent et par étapes basé sur les signaux des tests de laboratoire. Les résultats expérimentaux sur deux ensembles de données DSE publics démontrent que DuaLK surpasse systématiquement les bases de référence existantes dans quatre tâches de prédiction clinique. Ces résultats mettent en évidence le potentiel de la combinaison de connaissances médicales structurées avec des signaux cliniques à niveau individuel pour réaliser des prédictions diagnostiques plus précises et interprétables. Le code source est disponible publiquement sur https://github.com/humphreyhuu/DuaLK.
Hu et al. (Thu,) ont étudié cette question.