Key points are not available for this paper at this time.
L'utilisation du métabarcodage à lecture courte pour classer les microeukaryotes est confrontée à un manque de bases de données de référence 18S rRNA complètes. Bien que les récentes avancées dans le séquençage à long read de haute capacité offrent le potentiel d'augmenter considérablement la couverture phylogénétique de ces bases de données, les performances des différentes technologies de séquençage et le traitement bioinformatique ultérieur doivent encore être évalués, principalement en raison de l'absence de communautés fictives eucaryotes bien définies. Pour relever ce défi, nous avons créé une bibliothèque de clones d'opérons d'ARNr eucaryotes et l'avons transformée en une communauté fictive eucaryote précisément définie. Cette communauté fictive a ensuite été utilisée pour évaluer la performance de trois stratégies de séquençage à long read (séquençage de consensus circulaire PacBio et deux approches Nanopore utilisant des identifiants moléculaires uniques) et trois outils pour résoudre les variants de séquence d'amplicons (ASVs) (USEARCH, VSEARCH et DADA2). Nous avons examiné la sensibilité des techniques de séquençage en fonction du nombre de taxa fictifs détectés, et l'exactitude des différents outils d'appel ASV en mettant un accent particulier sur la présence de chimères parmi les ASVs d'opéron d'ARNr final. Sur la base de nos résultats, nous fournissons des recommandations et des protocoles de bonnes pratiques pour comment obtenir de manière rentable des opérons d'ARNr essentiellement sans erreur en haute capacité. Un échantillon de sol agricole a été utilisé pour démontrer que les résultats de séquençage et de bioinformatique de la communauté fictive se traduisent également par des échantillons naturels hautement divers, ce qui nous permet d'identifier des lignées de microeukaryotes précédemment non décrites.
Overgaard et al. (Mar,) ont étudié cette question.