Los puntos clave no están disponibles para este artículo en este momento.
Aspectos destacados•CD-LAAT: Un modelo de codificación ICD con atención a etiquetas y una pipeline de descripción de códigos.•CD-LAAT supera a los modelos de atención a etiquetas existentes en el rendimiento de codificación ICD.•Los modelos ensemblados utilizan informes de laboratorio y notas de médicos para mejorar la precisión de la codificación ICD. AbstractLa codificación de enfermedades es el proceso de asignar uno o más códigos diagnósticos estandarizados a las notas clínicas que son mantenidas por los profesionales de salud (por ejemplo, clínicos) para rastrear la condición del paciente. Este proceso de codificación suele ser costoso y propenso a errores, ya que lo realizan principalmente codificadores médicos humanos. La automatización de la codificación diagnóstica utilizando Inteligencia Artificial se considera una solución esencial en los Sistemas de Gestión de Información de Hospitales y los enfoques basados en Redes Neuronales Convolucionales son los que mejores resultados obtienen actualmente. En este trabajo, se propone un modelo neural construido sobre texto clínico no estructurado para permitir la codificación diagnóstica automática de resúmenes de alta de pacientes dados. Incorporamos un mecanismo de auto-atención estructurado diseñado para potenciar el aprendizaje de vectores específicos de etiquetas y los fragmentos de texto clínico significativos asociados con una cierta etiqueta para este fin. Estos vectores se combinan luego con una nueva pipeline de descripción de códigos que aprovecha las descripciones proporcionadas para cada código diagnóstico estandarizado. El modelo propuesto logró el mejor rendimiento en términos de métricas estándar sobre el conjunto de datos MIMIC-III, superando a modelos basados en Longformers y gráficos de conocimiento. Además, para aprovechar los datos clínicos estructurados y mejorar la predicción de códigos diagnósticos, se considera el ensamblaje de modelos. Se diseñó un modelo neural basado en datos estructurados aprovechando algoritmos de aprendizaje automático supervisado como random forest y boosting, para la clasificación de códigos multicategoría. Los resultados experimentales revelaron que los modelos ensemblados propuestos muestran un rendimiento prometedor en comparación con modelos tradicionales que dependen únicamente de datos clínicos estructurados o no estructurados, enfatizando su idoneidad para la implementación en el mundo real. Resumen gráfico
Merchant et al. (Sab,) estudiaron esta cuestión.