Los puntos clave no están disponibles para este artículo en este momento.
Resumen Objetivo El estudio tuvo como objetivo evaluar la eficacia del modelo de IA avanzado de OpenAI, ChatGPT, en el diagnóstico de condiciones urológicas, centrándose en los cálculos renales. Materiales y métodos Se elaboró un conjunto de 90 preguntas estructuradas, conforme a las Guías EAU 2023, por urólogos experimentados para esta investigación. Evaluamos el rendimiento de ChatGPT basado en la precisión y completitud de sus respuestas a dos tipos de preguntas: binarias (verdadero/falso) y descriptivas (de opción múltiple), estratificadas en niveles de dificultad: fácil, moderada y compleja. Además, analizamos la capacidad de aprendizaje y adaptabilidad del modelo al reevaluar las respuestas incorrectas inicialmente después de un intervalo de 2 semanas. Resultados El modelo demostró una precisión encomiable, respondiendo correctamente el 80% de las preguntas binarias (n: 45) y el 93.3% de las preguntas descriptivas (n: 45). El rendimiento del modelo no mostró variación significativa a través de los diferentes niveles de dificultad de las preguntas, con valores p de 0.548 para precisión y 0.417 para completitud, respectivamente. Al revaluar inicialmente 12 respuestas incorrectas (9 binarias a 3 descriptivas) después de dos semanas, la precisión de ChatGPT mostró una mejora sustancial. La puntuación media de precisión aumentó significativamente de 1.58 ± 0.51 a 2.83 ± 0.93 (p = 0.004), subrayando la capacidad del modelo para aprender y adaptarse con el tiempo. Conclusión Estos hallazgos destacan el potencial de ChatGPT en diagnósticos urológicos, pero también subrayan áreas que requieren mejoras, especialmente en la completitud de las respuestas a consultas complejas. El estudio respalda la incorporación de la IA en la atención sanitaria, al tiempo que aboga por la prudencia y la supervisión profesional en su aplicación.
Çil et al. (Thu,) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: