Key points are not available for this paper at this time.
يشغل جينوم SARS-CoV-2 مكانة فريدة في علم بيولوجيا العدوى - فهو أكثر الجينومات تسلسلًا على الأرض (مكونًا أكثر من 20% من مجموعات بيانات التسلسل العامة) مع معلومات دقيقة حول تاريخ العينة والجغرافيا، وقد خضع لتحليل مكثف غير مسبوق. نتيجةً لذلك، تعتبر هذه البيانات النسبية مورداً ذا قيمة هائلة للعلم والصحة العامة. ومع ذلك، فقد تم تسلسل الغالبية العظمى من البيانات عن طريق تداخل الأمبليكون عبر الجينوم الكامل، مع مخططات أمبليكون تغيرت خلال الجائحة حيث تفاعلت الطفرات في الجينوم الفيروسي مع مواقع ارتباط البرايمر. وبالإضافة إلى مجموعة سير عمل تجميع الجينوم المختلفة ونقص عمليات مراقبة الجودة (QC) المتسقة، فإن الجينومات الحالية تضم العديد من الأخطاء النظامية التي نشأت مع الفيروس ومخططات الأمبليكون. هذه الأخطاء لها تأثيرات كبيرة على علم النسب، ولذلك خلال السنوات القليلة الماضية، قضى الآلاف من ساعات وقت الباحثين في "تقدير" الأشجار، بحثًا عن الآثار، ومن ثم تصحيح الشجرة. نظرًا للقيمة الكبيرة لهذه المجموعة من البيانات، فقد بدأنا في إعادة معالجة المجموعة الكاملة من بيانات التسلسلات الخام العامة بطريقة صارمة تأخذ بعين الاعتبار الأمبليكون، وبناء شجرة نسالة أنظف. هنا نقدم شجرة عالمية تضم 4,471,579 عينة، تم بناؤها من مجموعة متسقة من تسلسلات الإجماع عالية الجودة من جميع البيانات العامة المتاحة حتى يونيو 2024، يمكن مشاهدتها على https://viridian.taxonium.org. تم بناء كل جينوم باستخدام أداة تجميع جديدة تُسمى Viridian (https://github.com/iqbal-lab-org/viridian)، تم تطويرها خصيصًا لمعالجة بيانات تسلسل الأمبليكون، مما يقضي على الأخطاء الأثرية ويخفي الجينوم في المواضع منخفضة الجودة. نقدم محاكاة والتحقق التجريبي من المنهجية، ونحدد التحسين في علم النسب. نأمل أن تكون الشجرة وتسلسلات الإجماع وViridian مورداً قيماً للباحثين.
درس هنت وآخرون (الثلاثاء) هذا السؤال.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: