What type of study is this?

This is a Quantitative Study study.

October 11, 2025Open Access

Modelo de lenguaje grande para interpretar la clasificación de París de pólipos colorrectales

Puntos clave

El M-LLM clasificó lesiones no polipoides de polipoides con una precisión del 73%, similar a la de expertos y no expertos.
La precisión para lesiones sésiles frente a pedunculadas fue de solo 55%, significativamente inferior a la de expertos y no expertos.
El análisis comparativo involucró 100 pólipos colorrectales únicos del conjunto de datos SUN, cada uno etiquetado con la clasificación de París.
El M-LLM tuvo un rendimiento comparable al de los endoscopistas en ciertas distinciones morfológicas, pero tuvo dificultades con lesiones pedunculadas.

Resumen

Resumen La notificación de la morfología de los pólipos colorrectales utilizando la clasificación de París a menudo es inexacta. Los modelos de lenguaje grandes multimodales (M-LLMs) pueden apoyar la evaluación morfológica. Este estudio tuvo como objetivo evaluar la precisión de un M-LLM (GPT-4o) en la clasificación de la morfología de los pólipos colorrectales en comparación con endoscopistas expertos y no expertos. Utilizamos el conjunto de datos SUN de videos de colonoscopia de 100 pólipos colorrectales únicos, cada uno etiquetado con la clasificación de París validada. Un M-LLM (GPT-4o) clasificó cinco marcos representativos por lesión. Tres endoscopistas expertos y tres no expertos, cegados entre sí, realizaron la misma tarea. El resultado primario fue la precisión en la diferenciación de lesiones no polipoides (IIa/IIc) de lesiones polipoides (Is/Ip/Isp). El resultado secundario fue la precisión en la diferenciación de lesiones sésiles (Is) de lesiones pedunculadas (Ip/Isp). Dado el diseño exploratorio, no se aplicó corrección por múltiples comparaciones; se presentan estimaciones puntuales con intervalos de confianza del 95% (IC), y los valores de P se interpretan descriptivamente. La precisión del M-LLM para diferenciar lesiones no polipoides de polipoides fue del 73% (IC del 95% 63%-81%), comparable a los expertos (75%, 65%-83%; P = 0.84) y no expertos (77%, 68%-85%; P = 0.52), con sensibilidad y especificidad similares. La precisión para diferenciar lesiones sésiles de pedunculadas fue del 55% (IC del 95% 42%-67%), inferior a la de los expertos (76%; P = 0.02) y no expertos (77%; P = 0.01), principalmente debido a una baja especificidad (12% frente a 82% de los expertos y 88% de los no expertos; P < 0.01 para ambas comparaciones). Los M-LLMs tuvieron un rendimiento comparable al de los endoscopistas al distinguir lesiones no polipoides de polipoides, pero no lograron identificar de manera confiable la morfología pedunculada.

Leer artículo completoexternamente

Me gusta

Guardar

Ver artículo completo