Key points are not available for this paper at this time.
L'intérêt pour l'utilisation du séquençage shotgun, plutôt que du séquençage par amplification, pour analyser les échantillons de microbiomes ne cesse de croître. Les projets typiques peuvent impliquer des centaines d'échantillons et des milliards de lectures de séquençage. La comparaison de tels échantillons avec une base de données de référence protéique génère des milliards d'alignements, et l'analyse de ces données représente un défi computationnel. Pour y remédier, nous avons considérablement réécrit et étendu notre outil d'analyse de microbiomes largement utilisé, MEGAN, afin de faciliter l'analyse interactive du contenu taxonomique et fonctionnel de très grands ensembles de données de microbiomes. D'autres caractéristiques nouvelles incluent un classificateur fonctionnel appelé InterPro2GO, l'assemblage de lectures centré sur les gènes, l'analyse des coordonnées principales de la taxonomie et de la fonction, et le support des métadonnées. Le nouveau programme s'appelle MEGAN Community Edition (CE) et est open source. En intégrant MEGAN CE avec notre outil d'alignement ADN-protéine à haut débit, DIAMOND, et en fournissant un nouveau programme, MeganServer, qui permet d'accéder aux fichiers d'analyse de métagénomes hébergés sur un serveur, nous proposons un pipeline simple, mais puissant et complet pour l'analyse des séquences de métagénomes shotgun. Nous illustrons comment réaliser une analyse computationnelle à grande échelle d'un projet de séquençage métagénomique, impliquant 12 échantillons et 800 millions de lectures, en moins de trois jours sur un serveur unique. Tout le code source est disponible ici : https://github.com/danielhuson/megan-ce.
Huson et al. (Tue,) ont étudié cette question.