Key points are not available for this paper at this time.
يعد التنبؤ بتأثيرات الطفرات في البروتينات أمرًا حاسمًا للعديد من التطبيقات، من فهم الأمراض الوراثية إلى تصميم بروتينات جديدة يمكن أن تعالج أبرز تحدياتنا في المناخ والزراعة والرعاية الصحية. على الرغم من الارتفاع الكبير في نماذج البروتين المعتمدة على التعلم الآلي لمعالجة هذه الأسئلة، فإن تقييم فوائدها المختلفة يمثل تحديًا بسبب استخدام مجموعات بيانات تجريبية متميزة، وغالبًا ما تكون مصطنعة، وأداء متغير للنماذج عبر عائلات بروتينية مختلفة. يتطلب معالجة هذه التحديات التوسع. لهذا الغرض، نقدم بروتين جيم، مجموعة شاملة من المعايير المصممة خصيصًا للتنبؤ باللياقة البدنية البروتينية والتصميم. تشمل مجموعة واسعة من أكثر من 250 اختبارًا معيارياً لفحص الطفرات العميقة، بما في ذلك ملايين التسلسلات المتحورة، بالإضافة إلى مجموعات بيانات سريرية منظمة تقدم تعليقات خبراء عالية الجودة حول تأثيرات الطفرات. نصمم إطارًا قويًا للتقييم يجمع بين المقاييس للتنبؤ باللياقة البدنية والتصميم، ويأخذ في الاعتبار القيود المعروفة للطرق التجريبية الأساسية، ويغطي كل من الإعدادات دون ضوابط والإشراف. نبلغ عن أداء مجموعة متنوعة من أكثر من 70 نموذجًا عالي الأداء من مجالات فرعية مختلفة (مثل، المعتمد على المحاذاة، الطي العكسي) في مجموعة معايير موحدة. نوفر الكود المصدر المقابل، ومجموعات البيانات، والـ MSAs، والهياكل، وتنبؤات النماذج، ونطور موقعًا إلكترونيًا سهل الاستخدام يسهل الوصول إلى البيانات وتحليلها.
درس نوتين وآخرون (الجمعة) هذا السؤال.