Key points are not available for this paper at this time.
في مجال تحليل البيانات الطبية، يعد تحويل مستندات النص غير المنظمة إلى تنسيق منظم مناسب للاستخدام اللاحق تحديًا كبيرًا. تقدم هذه الدراسة خط أنابيب آلي محلي موثوق يضمن الخصوصية للبيانات، حيث يستخدم نماذج لغة كبيرة مفتوحة المصدر (LLMs) مع بنية الجيل المدعوم بالاسترجاع (RAG) لتحويل وثائق اللغة الألمانية الطبية التي تحتوي على معلومات صحية حساسة إلى تنسيق منظم. أثبتت التجارب على مجموعة بيانات تملكها الشركة تضم 800 تقرير طبي أصلي غير منظم دقة تصل إلى 90% في استخراج البيانات من الخط الأنبوب مقارنة بالبيانات المستخرجة يدويًا من قبل الأطباء وطلاب الطب. ويبرز هذا إمكانية الخط الأنبوب كأداة قيمة لاستخراج البيانات ذات الصلة بكفاءة من المصادر غير المنظمة.
درس وانغ وآخرون (Thu) هذا السؤال.