Key points are not available for this paper at this time.
Zusammenfassung Motivation: Eine kritische Aufgabe in der Hochdurchsatz-Sequenzierung ist das Ausrichten von Millionen von kurzen Reads auf ein Referenzgenom. Die Ausrichtung ist insbesondere bei RNA-Sequenzierung (RNA-Seq) aufgrund von RNA-Spleißung kompliziert. Es stehen eine Reihe von RNA-Seq-Algorithmen zur Verfügung, die behaupten, Reads mit hoher Genauigkeit und Effizienz auszurichten und dabei Spleißstellen zu erkennen. RNA-Seq-Daten sind diskret in ihrer Natur; daher können bei angemessenen Genmodellen und vergleichenden Metriken RNA-Seq-Daten ausreichend genau simuliert werden, um sinnvolle Benchmarking-Verfahren für die Alignierungsalgorithmen zu ermöglichen. Die Übung, alle praktikablen veröffentlichten RNA-Seq-Algorithmen rigoros zu vergleichen, wurde bisher nicht durchgeführt. Ergebnisse: Wir haben einen RNA-Seq-Simulator entwickelt, der die wesentlichen Hindernisse für RNA-Ausrichtung modelliert, einschließlich alternativen Spleißens, Einfügungen, Löschungen, Substitutionen, Sequenzierungsfehlern und Intronsignalen. Wir haben diesen Simulator verwendet, um die Genauigkeit und Robustheit der verfügbaren Algorithmen auf Basis- und Junction-Ebenen zu messen. Darüber hinaus haben wir die umgekehrte Transkriptase-Polymerase-Kettenreaktion (RT-PCR) und die Sanger-Sequenzierung verwendet, um die Fähigkeit der Algorithmen zu validieren, neuartige Transkriptmerkmale wie neuartige Exons und alternatives Spleißen in RNA-Seq-Daten aus der Maus-Retina zu erkennen. Eine Pipeline, die auf BLAT basiert, wurde entwickelt, um die Leistung etablierter Werkzeuge für dieses Problem zu erkunden und sie mit den kürzlich entwickelten Methoden zu vergleichen. Diese Pipeline, der RNA-Seq Unified Mapper (RUM), leistet vergleichbare Ergebnisse wie die besten aktuellen Alignierer und bietet eine vorteilhafte Kombination aus Genauigkeit, Geschwindigkeit und Benutzerfreundlichkeit. Verfügbarkeit: Die RUM-Pipeline wird über die Amazon Cloud und für Rechencluster unter Verwendung der Sun Grid Engine verteilt (http://cbil.upenn.edu/RUM). Kontakt: ggrant@pcbi.upenn.edu; epierce@mail.med.upenn.edu Ergänzende Informationen: Die im Artikel beschriebenen RNA-Seq-Sequenzreads sind am GEO, Zugangsnummer GSE26248, hinterlegt.
Grant et al. (Di,) untersuchten diese Frage.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: