Key points are not available for this paper at this time.
مع الزيادة الكبيرة في بيانات البروتين، تعتبر إحدى المشكلات الهامة هي تقدير عدد المجموعات المعقولة ضمن عائلة بروتين كبيرة، وذلك للتحليلات الهيكلية والوظيفية والتطورية المتعمقة لاحقاً. لمواجهة هذه المشكلة، طورنا برنامجا جديدا، سيكاتور، الذي ينفذ مبدأ طريقة هرمية تصاعدية باستخدام مصفوفة المسافات المستندة إلى محاذاة متعددة لتسلسلات البروتين. يتم تقسيم قيم عدم التشابه المعينة للعقد في شجرة تصنيفية مستنتجة بواسطة قاعدة توقف جديدة تم تقديمها لتحديد قيم عدم التشابه الهامة تلقائياً. يتم التحقق من جودة الكتل الناتجة عن سيكاتور من خلال دراسة Jackknife منفصلة. تم توضيح الطريقة على 24 عائلة بروتين كبيرة تغطي طيفاً واسعاً من الحفظ الهيكلي والتسلسلي، وتم توضيح فائدتها ودقتها مع بيانات بيولوجية حقيقية على عائلتين من البروتينات المدروسة جيدًا (بروتينات Sm والمستقبلات النووية).
درس ويكر وآخرون (الأربعاء) هذا السؤال.