What does this research mean for the field?

Large Language Models can effectively automate the extraction of structured medication information from clinical texts, with performance varying significantly between zero-shot and few-shot paradigms. Novelty: ClaimNovelty.NOVEL_FINDING. Consensus alignment: ConsensusAlignment.NEUTRAL.

What question did this study set out to answer?

The aim is to evaluate the feasibility of using large language models for structured medication extraction from unstructured clinical narratives.

February 28, 2026Open Access

جدوى استخدام نماذج اللغة الكبيرة لاستخراج معلومات الأدوية بطريقة منظمة من النصوص السريرية: تحليل مقارن للطرائق غير المشروطة وعدد قليل من الطلبيات.

Key Points

The aim is to evaluate the feasibility of using large language models for structured medication extraction from unstructured clinical narratives.
Evaluated five open-weight architectures: GPT-OSS:20B, Gemma 2:9B, Mistral 7B, Qwen3:14B, and Llama 3.2.
Employing Zero-Shot and Few-Shot prompting paradigms for performance comparison.
Sourced outpatient antimicrobial clinical notes from the CHARM registry.
GPT-OSS:20B achieved F1 scores greater than 0.90 in the Zero-Shot setting.
Gemma 2:9B reached approximately F1 ~ 0.99, outperforming larger models in Few-Shot tasks.
Smaller models encountered a 'hallucination barrier', limiting their unsupervised clinical application.

Abstract

رافق رقمنة الرعاية الصحية توسيع سريع لسجلات الصحة الإلكترونية (EHRs)؛ ومع ذلك، لا يزال جزء كبير من بيانات المرضى الحرجة، وبالتحديد نظم الأدوية، محجوزة داخل السرد السريري غير المنظم. تعيق القدرة على حساب هذه البيانات بسلاسة من التقدم في مراقبة الأدوية، ودعم اتخاذ القرار السريري، وإدارة صحة السكان. تقدم هذه الدراسة تقييماً شاملاً ودقيقاً لجدوى استخدام نماذج اللغة الكبيرة (LLMs) لأتمتة استخراج معلومات الجرعة المنظمة (الجرعة، التردد اليومي، المدة) من الملاحظات السريرية الخارجية المضادة للميكروبات المأخوذة من سجل تعاون مواءمة قياسات السجل المضاد للميكروبات (CHARM). قمنا بدراسة أداء خمس هياكل مفتوحة الوزن، وهي GPT-OSS:20B، Gemma 2:9B، Mistral 7B، Qwen3:14B وLlama 3.2، عبر كل من نماذج Zero-Shot وFew-Shot المعززة بالاسترجاع (RAG). تكشف تحليلاتنا عن تسوية معمارية أساسية: تسود GPT-OSS:20B المحسنة للتفكير في مشهد zero-shot (F1 > 0.90) من خلال استغلال فهم المخططات التجريدية، بينما تتفوق Gemma 2:9B المعدلة لتعليمات في إعداد few-shot (F1 ~ 0.99)، مستخدمة الأمثلة كحواجز لتجاوز النماذج الأكبر. بالمقابل، تظهر النماذج الأصغر (Mistral، Llama) حاجز

جدوى استخدام نماذج اللغة الكبيرة لاستخراج معلومات الأدوية بطريقة منظمة من النصوص السريرية: تحليل مقارن للطرائق غير المشروطة وعدد قليل من الطلبيات.

Key Points

Abstract

Cite This Study