Los puntos clave no están disponibles para este artículo en este momento.
Objetivo: Presentamos un sistema de escriba digital como prueba de concepto como pipeline de resumen de conversaciones clínicas en el ED y reportamos su rendimiento. Materiales y Métodos: Utilizamos cuatro modelos de lenguaje grande pre-entrenados para establecer el sistema de escriba digital: T5-small, T5-base, PEGASUS-PubMed y BART-Large-CNN mediante enfoques de zero-shot y ajuste fino. Nuestro conjunto de datos incluye 100 conversaciones de referencia entre clínicos del ED y registros médicos. Informamos el ROUGE-1, ROUGE-2 y ROUGE-L para comparar el rendimiento del modelo. Además, anotamos transcripciones para evaluar la calidad de los resúmenes generados. Resultados: =0.22). El rendimiento de BART-Large-CNN disminuye en más del 50% con el enfoque de zero-shot. Las anotaciones muestran que BART-Large-CNN tiene un 71.4% de recuperación en la identificación de información clave y una tasa de precisión del 67.7%. Discusión: El modelo BART-Large-CNN demuestra un alto nivel de comprensión de la estructura del diálogo clínico, indicado por su rendimiento con y sin ajuste fino. A pesar de algunas instancias de alta recuperación, hay variabilidad en el rendimiento del modelo, particularmente en lograr una corrección consistente, lo que sugiere margen para refinamiento. La capacidad de recuperación del modelo varía según diferentes categorías de información. Conclusión: El estudio proporciona evidencia sobre el potencial de herramientas asistidas por IA para reducir la carga de documentación clínica. Se sugiere un trabajo futuro que amplíe el alcance de la investigación con modelos de lenguaje más grandes y un análisis comparativo para medir los esfuerzos y el tiempo de documentación.
Sezgın et al. (Thu,) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: