Key points are not available for this paper at this time.
Résumé Contexte Bien que le nombre total de taxons microbiens sur Terre soit débattu, il est clair qu'une petite fraction de ceux-ci a été cultivée et valablement nommée. Évidemment, l'incapacité de cultiver la plupart des bactéries en dehors de conditions très spécifiques limite sévèrement leur caractérisation et les études ultérieures. Au cours de la dernière décennie, une grande partie de la solution à ce problème a été l'utilisation du séquençage de métagénomes, par lequel l'ADN d'une communauté microbienne entière est séquencé, suivi de la reconstruction in silico des génomes de ses espèces composantes nouvelles. La grande divergence entre le nombre de génomes de souches types séquencés (environ 12 000) et la diversité microbienne totale (10^6 – 10^12 espèces) dirige ces efforts vers l'assemblage de novo et le binning. Malheureusement, ces étapes sont sujettes aux erreurs et, en tant que telles, les résultats doivent être scrutés intensément pour éviter de publier des génomes incomplets et de faible qualité. Résultats Nous avons développé MAGISTA (évaluation des statistiques intra-bin des génomes assemblés par métagénome), une approche novatrice pour évaluer la qualité des génomes assemblés par métagénome qui aborde certains des inconvénients souvent négligés des méthodes actuelles basées sur des gènes de référence. MAGISTA est fondé sur des distributions de distances sans alignement entre les fragments de contigs au sein des bins métagénomiques, plutôt que sur un ensemble de gènes de référence. Pour un entraînement adéquat, une communauté d'ADN génomique fictive hautement complexe était nécessaire et construite en réunissant l'ADN génomique de 227 souches bactériennes, spécifiquement sélectionnées pour obtenir une grande variété représentant les principales lignées phylogénétiques des bactéries cultivables. Conclusions MAGISTA a réussi à réduire de 20 % l'erreur quadratique moyenne par rapport à l'approche par gènes marqueurs lors des tests sur des métagénomes fictifs disponibles publiquement. De plus, notre communauté d'ADN génomique fictive hautement complexe est un outil très précieux pour évaluer (de nouvelles) méthodes d'analyse de métagénome.
Goussarov et al. (Samedi) ont étudié cette question.