Los puntos clave no están disponibles para este artículo en este momento.
En la última década, la secuenciación de nueva generación (NGS) ha permitido la generación de datos genómicos de manera rentable y a gran escala. Las tecnologías de secuenciación de tercera generación producen lecturas más largas; sin embargo, sus tasas de error son mucho más altas, lo que complica el proceso de ensamblaje. Esto genera ensambladores de lecturas largas que requieren mucho tiempo y espacio. Además, los avances en estas tecnologías han permitido la secuenciación de ADN portátil y en tiempo real, lo que permite el análisis en el campo. En estos escenarios, se vuelve crucial contar con soluciones más eficientes que se puedan ejecutar en computadoras o dispositivos móviles con requisitos de hardware mínimos. Reimplementamos un ensamblador existente dedicado a lecturas largas, más concretamente Flye, utilizando estructuras de datos comprimidas. Luego comparamos nuestra versión con el software original utilizando conjuntos de datos reales y evaluamos su rendimiento en términos de requisitos de memoria, velocidad de ejecución y consumo de energía. Los resultados del ensamblaje no se ven afectados, ya que se mantiene el núcleo del algoritmo, pero el uso de estructuras de datos compactas avanzadas conduce a mejoras en el consumo de memoria que oscilan entre un 22% y un 47% menos espacio, y en el tiempo de procesamiento, que varían desde estar a la par hasta disminuir en un 25%. Estas mejoras también causan reducciones en el consumo de energía de alrededor del 3-8%, con algunos conjuntos de datos obteniendo disminuciones de hasta el 26%.
Freire et al. (Mié,) estudiaron esta cuestión.