Los puntos clave no están disponibles para este artículo en este momento.
La metagenómica es un campo en rápida expansión que utiliza tecnología de secuenciación de nueva generación para analizar la composición genética de muestras ambientales. Sin embargo, identificar con precisión los organismos en una muestra metagenómica puede ser complejo, y los métodos tradicionales basados en referencias pueden no ser efectivos en algunas instancias. En este estudio, presentamos un enfoque novedoso para la identificación metagenómica, utilizando compresores de datos como una característica para la clasificación taxonómica. Al evaluar un conjunto integral de compresores, incluidos tanto los de propósito general como los específicos de genómica, demostramos la efectividad de este método para identificar con precisión organismos en muestras metagenómicas. Los resultados indican que utilizar características de múltiples compresores puede ayudar a identificar la taxonomía. Se logró una precisión general del 95% utilizando este método con un conjunto de datos desbalanceado con clases con muestras limitadas. El estudio también mostró que la correlación entre compresión y clasificación es insignificante, destacando la necesidad de un enfoque multifacético para la identificación metagenómica. Este enfoque representa un avance significativo en el campo de la metagenómica, proporcionando un método sin referencia para la identificación taxonómica que es tanto efectivo como eficiente, mientras revela información sobre la naturaleza estadística y algorítmica de los datos genómicos. El código para validar este estudio está disponible públicamente en https://github.com/ieeta-pt/xgTaxonomy.
Silva et al. (Wed,) estudiaron esta cuestión.