Das Internationale Klassifikationssystem der Krankheiten (ICD) standardisiert klinische Texte, um den Informationsgewinnungsprozess im Gesundheitswesen und in der Forschung zu verbessern. Allerdings funktionieren die meisten bestehenden automatisierten Kodierungssysteme als 'Black Boxes', was die Notwendigkeit erklärbarer Ansätze hervorhebt, die Transparenz und interpretable Lösungen bieten. In dieser Arbeit präsentieren wir ein End-to-End-System, das erklärbare klinische Kodierungsprognosen bereitstellt. Wir entwickeln ein dreiphasiges System für erklärbare klinische Kodierung. In Phase 1 werden Textauszüge, die potenziell ICD-Codes beschreiben, mithilfe verschiedener Named Entity Recognition (NER) Modelle erkannt. Phase 2 wendet ein überwachtes Textklassifikationsmodell mit einem Vertrauensschwellenwert an, während in Phase 3 Fälle mit niedrigem Vertrauen mithilfe eines semantischen Ähnlichkeitsmodells klassifiziert werden, das aus ICD-Code-Beschreibungen und verwandten Schlüsselphrasen erstellt wurde. Das System wird an vier Korpora in Spanisch und Englisch evaluiert, die mit ICD-Codes aus drei Varianten (ICD-10-CM, ICD-10-PCS und ICD-O-3) und ihren entsprechenden textlichen Erwähnungen annotiert sind. Insgesamt erweist sich das System als robust und wettbewerbsfähig im Vergleich zu modernen Ansätzen, übertrifft die meisten von ihnen und erreicht eine durchschnittliche Verbesserung des F1-Scores um 3,42 %. Diese Studie präsentiert eine der umfassendsten Bewertungen eines erklärbaren klinischen Kodierungssystems über Sprachen und ICD-Varianten hinweg. Der vorgeschlagene Ansatz zeigt eine starke Robustheit und Generalisierung und kann effektiv mit unbekannten Codes sowie mit nicht kontinuierlichen und überlappenden Entitäten umgehen.
Ramirez-Arrabe et al. (Tue,) untersuchten diese Frage.