Key points are not available for this paper at this time.
تستخدم خوارزميات التضمين بشكل متزايد لتمثيل المفاهيم السريرية في الرعاية الصحية لتحسين مهام التعلم الآلي مثل تصنيف الظواهر السريرية وتنبؤ الأمراض. لقد تكيفت الدراسات الحديثة مع تمثيلات المحولات الثنائية الاتجاه من بنية BERT للسجلات الصحية الإلكترونية المنظمة لتوليد تضمينات مفاهيمية سياقية، ولكنها لا تدمج بالكامل البيانات الزمنية عبر مجالات سريرية متعددة. لذلك، طورنا تكيفًا جديدًا لـ BERT، CEHR-BERT، لدمج المعلومات الزمنية باستخدام نهج هجين من خلال تعزيز المدخلات إلى BERT باستخدام رموز زمنية مصطنعة وإدماج التوقيت والعمر وتضمينات المفاهيم، وطرح هدف تعلم ثانٍ جديد لنوع الزيارة. تم تدريب CEHR-BERT على مجموعة فرعية من بيانات المركز الطبي بجامعة كولومبيا - مستشفى يورك بريسبتريان، والتي تشمل 2.4 مليون مريض، على مدار ثلاثة عقود، وتم اختباره باستخدام التصحيح المتقاطع 4-fold على مهام التنبؤ التالية: الاستشفاء، الموت، تشخيص جديد لفشل القلب (HF)، وإعادة إدخال HF. تُظهر تجاربنا أن CEHR-BERT تفوق على التكيفات السريرية الحالية لـ BERT والنماذج الأساسية في جميع مهام التنبؤ الأربعة في كل من ROC-AUC و PR-AUC. كما أظهر CEHR-BERT قدرة قوية على التعلم النقي، حيث تفوق نموذجنا المدرب على 5% فقط من البيانات على نماذج المقارنة المدربة على المجموعة الكاملة من البيانات. أظهرت دراسات الإزالة لفهم أفضل لمساهمة كل مكون زمني مكاسب تراكمية مع كل عنصر، مما يشير إلى أن دمج CEHR-BERT للرموز الزمنية الاصطناعية، وتضمينات التوقيت والعمر مع تضمينات المفاهيم، وإضافة الهدف التعلمي الثاني يمثل نهجًا واعدًا للتضمينات السريرية المعتمدة على BERT في المستقبل.
درس بانغ وآخرون (الأربعاء) هذا السؤال.