Key points are not available for this paper at this time.
In den letzten zehn Jahren ermöglichte das Next-Generation Sequencing (NGS) die kosteneffektive und hochdurchsatzmäßige Generierung von genomischen Daten. Die neuesten Sequenzierungstechnologien der dritten Generation produzieren längere Reads; ihre Fehlerraten sind jedoch viel höher, was den Assemblierungsprozess kompliziert. Dies führt zu zeit- und speicherintensiven Long-Read-Assemblern. Darüber hinaus haben die Fortschritte in diesen Technologien tragbare und Echtzeit-DNA-Sequenzierung ermöglicht, die eine Analyse im Feld erlaubt. In diesen Szenarien wird es entscheidend, effizientere Lösungen zu haben, die auf Computern oder mobilen Geräten mit minimalen Hardwareanforderungen ausgeführt werden können. Wir haben einen bestehenden Assembler für Long Reads, konkreter gesagt Flye, mit kompakten Datenstrukturen neu implementiert. Wir vergleichen unsere Version dann mit der Originalsoftware anhand realer Datensätze und bewerten deren Leistung hinsichtlich Speicheranforderungen, Ausführungsgeschwindigkeit und Energieverbrauch. Die Ergebnisse der Assemblierung sind nicht betroffen, da der Kern des Algorithmus erhalten bleibt, aber die Nutzung fortschrittlicher kompakter Datenstrukturen führt zu Verbesserungen im Speicherverbrauch, die von 22 % bis 47 % weniger Platz reichen, und in der Verarbeitungszeit, die von gleichwertig bis zu 25 % verringert werden kann. Diese Verbesserungen führen auch zu einer Reduzierung des Energieverbrauchs von etwa 3-8 %, wobei einige Datensätze sogar bis zu 26 % Einsparungen erzielen.
Freire et al. (Mittwoch) haben diese Frage untersucht.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: