Key points are not available for this paper at this time.
Objetivo: A inteligência artificial tornou-se recentemente disponível para uso amplo na medicina, incluindo a interpretação de informações digitalizadas, grandes dados para rastreamento de tendências e padrões de doenças, e diagnóstico clínico. Estudos comparativos e opiniões de especialistas apoiam a validade da análise de imagem e dados, no entanto, uma validação semelhante está faltando no diagnóstico clínico. Os programas de inteligência artificial são aqui comparados com um programa gerador de diagnósticos em neurologia clínica. Métodos: Usando 4 registros de casos selecionados não aleatoriamente de conferências clinicopatológicas do New England Journal of Medicine de 2017 a 2022, 2 programas de inteligência artificial (ChatGPT-4 e GLASS AI) foram comparados com um programa gerador de diagnósticos neurológicos (NeurologicDx.com) pela capacidade de diagnóstico e precisão e autenticação de fontes. Resultados: Em comparação com NeurologicDx.com, os 2 programas de IA mostraram resultados variando com a ordem de entrada de termos-chave e com consultas repetidas. O gerador de diagnóstico produziu mais entidades diagnósticas diferenciais, com diagnósticos corretos em 4 de 4 casos de teste contra 0 de 4 para ChatGPT-4 e 1 de 4 para GLASS AI, respectivamente, e com autenticação de entidades diagnósticas em comparação com os programas de IA. Conclusões: O gerador de diagnóstico NeurologicDx produziu uma lista de diagnóstico diferencial mais robusta e reprodutível, com maior precisão diagnóstica e autenticação associada em comparação com programas de inteligência artificial.
Pasquale F. Finelli (Terça,) estudou esta questão.