Key points are not available for this paper at this time.
Os ensaios clínicos são um componente essencial do desenvolvimento de medicamentos para novos tratamentos contra o câncer, no entanto, as informações necessárias para determinar a elegibilidade de um paciente para inscrição estão dispersas em grandes quantidades de texto não estruturado. Biomarcadores genômicos são especialmente importantes na medicina de precisão e terapias direcionadas, tornando-os essenciais para combinar pacientes a ensaios apropriados. Modelos de linguagem de grande escala (LLMs) oferecem uma solução promissora para extrair essas informações dos dados de ensaios clínicos, auxiliando tanto médicos quanto pacientes na identificação de correspondências adequadas. Neste estudo, exploramos várias estratégias de LLM para extrair biomarcadores genéticos de ensaios oncológicos para melhorar as taxas de inscrição de pacientes. Nossos resultados mostram que modelos de linguagem de código aberto, quando aplicados prontamente, capturam efetivamente expressões lógicas complexas e estruturam biomarcadores genômicos em forma normal disjuntiva, superando modelos de código fechado, como GPT-4 e GPT-3.5-Turbo. Além disso, o ajuste fino desses modelos de código aberto com dados adicionais melhora significativamente seu desempenho.
Khoury et al. (qui,) estudaram essa questão.