Key points are not available for this paper at this time.
أظهرت نماذج اللغة الكبيرة (LLMs) قدرات واعدة في التعامل مع مهام تلخيص النصوص السريرية. في هذه الدراسة، نوضح أنه يمكن تدريب نموذج LLM مفتوح المصدر صغير الحجم بشكل فعال لتوليد ملاحظات سريرية عالية الجودة من حوارات المرضى مع الأطباء. نحقق ذلك من خلال عملية تعديل شاملة خاصة بالمجال والمهمة لنموذج LLaMA-2 المكون من 13 مليار معلمة. تتضمن هذه العملية استمرار التدريب المسبق، والتعديل الدقيق تحت إشراف، وتعلم التعزيز من كل من الذكاء الاصطناعي وملاحظات البشر. قدمنا نهجًا محسّنًا، يسمى DistillDirect، لأداء تعلم التعزيز وفق السياسات مع نموذج Gemini Pro كمعلم. نموذجنا الناتج، LLaMA-Clinic، قادر على توليد ملاحظات سريرية تتساوى جودتها مع تلك التي كتبها الأطباء. في دراسة قارئ الطبيب المجهول، قيم غالبية (90.4٪) من التقييمات الفردية الملاحظات التي تم توليدها بواسطة LLaMA-Clinic على أنها "مقبولة" أو أعلى عبر جميع المعايير الثلاثة: الجاهزية للعالم الحقيقي، الاكتمال، والدقة. من الجدير بالذكر أنه في قسم "التقييم والخطة" الأكثر تحديًا، حصلت LLaMA-Clinic على درجات أعلى (4.2/5) في الجاهزية للعالم الحقيقي مقارنة بالملاحظات التي كتبها الأطباء (4.1/5). بالإضافة إلى ذلك، حددنا بعض المحاذير في مجموعات بيانات الملاحظات السريرية العامة، مثل ACI-BENCH. نبرز اعتبارات رئيسية لمهام توليد الملاحظات السريرية المستقبلية، مع التأكيد على أهمية تحديد شكل الملاحظات المثلى مسبقًا. بشكل عام، تظهر أبحاثنا إمكانية وواقعية تدريب نماذج LLMs الأصغر والأكثر انفتاحًا للمساعدة في التوثيق السريري، مستفيدة من وصول المؤسسات الصحية إلى سجلات المرضى وخبرة المجال. لقد جعلنا مجموعة بيانات حوارات العيادة الاصطناعية الجديدة ومجموعة بيانات ملاحظات الأطباء متاحة للجمهور لتعزيز البحث المستقبلي في هذا المجال.
درس وانغ وآخرون (الخميس) هذا السؤال.