Key points are not available for this paper at this time.
لقد تم التعرف على توليد بيانات السجل الصحي الإلكتروني (EHR) الاصطناعية بشكل متزايد كحل مهم لتوسيع الوصول وتعظيم قيمة البيانات الصحية الخاصة على نطاق واسع. وقد سهلت التقدمات الأخيرة في تعلم الآلة نمذجة أكثر دقة للبيانات المعقدة وعالية الأبعاد، مما يعزز بشكل كبير جودة بيانات السجل الصحي الإلكتروني الاصطناعية. من بين الأساليب المختلفة، أصبحت الشبكات التنافسية التوليدية (GANs) المسار التقني الرئيسي في الأدبيات نظراً لقدرتها على التقاط الخصائص الإحصائية للبيانات الحقيقية. ومع ذلك، هناك نقص في الإرشادات التفصيلية داخل هذا المجال بشأن إجراءات تطوير بيانات السجل الصحي الإلكتروني الاصطناعية. الهدف من هذا الدليل هو تقديم عملية شفافة وقابلة لإعادة الإنتاج لتوليد بيانات السجل الصحي الإلكتروني الاصطناعية المهيكلة باستخدام مجموعة بيانات سجلات صحية إلكترونية متاحة للجمهور كمثال. نقوم بتغطية مواضيع هيكل GAN، وأنواع بيانات السجل الصحي الإلكتروني وتمثيلها، وما قبل معالجة البيانات، وتدريب GAN، وتوليد البيانات الاصطناعية والمعالجة اللاحقة، وتقييم جودة البيانات. نختتم هذا الدليل بمناقشة العديد من القضايا المهمة والفرص المستقبلية في هذا المجال. تم جعل كود المصدر للعملية كاملة متاحًا للجمهور.
درس يان وآخرون (Thu،) هذا السؤال.