رافق رقمنة الرعاية الصحية توسيع سريع لسجلات الصحة الإلكترونية (EHRs)؛ ومع ذلك، لا يزال جزء كبير من بيانات المرضى الحرجة، وبالتحديد نظم الأدوية، محجوزة داخل السرد السريري غير المنظم. تعيق القدرة على حساب هذه البيانات بسلاسة من التقدم في مراقبة الأدوية، ودعم اتخاذ القرار السريري، وإدارة صحة السكان. تقدم هذه الدراسة تقييماً شاملاً ودقيقاً لجدوى استخدام نماذج اللغة الكبيرة (LLMs) لأتمتة استخراج معلومات الجرعة المنظمة (الجرعة، التردد اليومي، المدة) من الملاحظات السريرية الخارجية المضادة للميكروبات المأخوذة من سجل تعاون مواءمة قياسات السجل المضاد للميكروبات (CHARM). قمنا بدراسة أداء خمس هياكل مفتوحة الوزن، وهي GPT-OSS:20B، Gemma 2:9B، Mistral 7B، Qwen3:14B وLlama 3.2، عبر كل من نماذج Zero-Shot وFew-Shot المعززة بالاسترجاع (RAG). تكشف تحليلاتنا عن تسوية معمارية أساسية: تسود GPT-OSS:20B المحسنة للتفكير في مشهد zero-shot (F1 > 0.90) من خلال استغلال فهم المخططات التجريدية، بينما تتفوق Gemma 2:9B المعدلة لتعليمات في إعداد few-shot (F1 ~ 0.99)، مستخدمة الأمثلة كحواجز لتجاوز النماذج الأكبر. بالمقابل، تظهر النماذج الأصغر (Mistral، Llama) حاجز
Schulte et al. (Fri,) studied this question.