Resumen La notificación de la morfología de los pólipos colorrectales utilizando la clasificación de París a menudo es inexacta. Los modelos de lenguaje grandes multimodales (M-LLMs) pueden apoyar la evaluación morfológica. Este estudio tuvo como objetivo evaluar la precisión de un M-LLM (GPT-4o) en la clasificación de la morfología de los pólipos colorrectales en comparación con endoscopistas expertos y no expertos. Utilizamos el conjunto de datos SUN de videos de colonoscopia de 100 pólipos colorrectales únicos, cada uno etiquetado con la clasificación de París validada. Un M-LLM (GPT-4o) clasificó cinco marcos representativos por lesión. Tres endoscopistas expertos y tres no expertos, cegados entre sí, realizaron la misma tarea. El resultado primario fue la precisión en la diferenciación de lesiones no polipoides (IIa/IIc) de lesiones polipoides (Is/Ip/Isp). El resultado secundario fue la precisión en la diferenciación de lesiones sésiles (Is) de lesiones pedunculadas (Ip/Isp). Dado el diseño exploratorio, no se aplicó corrección por múltiples comparaciones; se presentan estimaciones puntuales con intervalos de confianza del 95% (IC), y los valores de P se interpretan descriptivamente. La precisión del M-LLM para diferenciar lesiones no polipoides de polipoides fue del 73% (IC del 95% 63%-81%), comparable a los expertos (75%, 65%-83%; P = 0.84) y no expertos (77%, 68%-85%; P = 0.52), con sensibilidad y especificidad similares. La precisión para diferenciar lesiones sésiles de pedunculadas fue del 55% (IC del 95% 42%-67%), inferior a la de los expertos (76%; P = 0.02) y no expertos (77%; P = 0.01), principalmente debido a una baja especificidad (12% frente a 82% de los expertos y 88% de los no expertos; P < 0.01 para ambas comparaciones). Los M-LLMs tuvieron un rendimiento comparable al de los endoscopistas al distinguir lesiones no polipoides de polipoides, pero no lograron identificar de manera confiable la morfología pedunculada.
Massimi et al. (Jue,) estudiaron esta cuestión.