August 13, 2018Open Access

Skalierung der Datenkuratierung mittels Deep Learning: Eine Anwendung zur Literaturtriage in Ressourcen für genomische Variation

Key Points

Key points are not available for this paper at this time.

Abstract

Die manuelle Kuratierung biomedizinischen Wissens aus Veröffentlichungen ist notwendig, um einen wissensbasierten Dienst aufzubauen, der den Nutzern hochpräzise und organisierte Informationen bereitstellt. Der Prozess der Auffindung relevanter Veröffentlichungen zur Kuratierung, auch bekannt als Dokumenttriage, erfolgt in der Regel durch Abfragen und Lesen von Artikeln in PubMed. Diese abfragebasierte Methode erzielt jedoch oft unzureichende Präzision und Rückruf bei den abgerufenen Ergebnissen, und es ist schwierig, manuell optimale Abfragen zu generieren. Um dem entgegenzuwirken, schlagen wir eine maschinenunterstützte Triage-Methode vor. Wir sammeln zuvor kuratierte Veröffentlichungen aus zwei Datenbanken, UniProtKB/Swiss-Prot und dem NHGRI-EBI GWAS-Katalog, und verwenden diese als Goldstandard-Datensatz zur Schulung von Deep-Learning-Modellen basierend auf konvolutionalen neuronalen Netzen. Anschließend verwenden wir die trainierten Modelle, um neue Veröffentlichungen für die Kuratierung zu klassifizieren und zu bewerten. Zur Evaluierung wenden wir unsere Methode auf den realen manuellen Kurationsprozess von UniProtKB/Swiss-Prot und dem GWAS-Katalog an. Wir zeigen, dass unsere maschinenunterstützte Triage-Methode die aktuellen abfragebasierten Triage-Methoden übertrifft, die Effizienz verbessert und kuratierte Inhalte bereichert. Unsere Methode erreicht eine Präzision, die 1,81- und 2,99-mal höher ist als die der aktuellen abfragebasierten Triage-Methoden von UniProtKB/Swiss-Prot und dem GWAS-Katalog, ohne den Rückruf zu beeinträchtigen. In der Tat ruft unsere Methode viele zusätzliche relevante Veröffentlichungen ab, die die abfragebasierte Methode von UniProtKB/Swiss-Prot nicht finden konnte. Diese Ergebnisse zeigen, dass unsere auf maschinellem Lernen basierende Methode den Triage-Prozess effizienter gestalten kann und in die Produktion implementiert wird, damit menschliche Kuratoren sich auf herausforderndere Aufgaben konzentrieren können, um die Qualität von Wissensdatenbanken zu verbessern.

Bookmark

View Full Paper

Bookmark

View Full Paper

Skalierung der Datenkuratierung mittels Deep Learning: Eine Anwendung zur Literaturtriage in Ressourcen für genomische Variation

Key Points

Abstract

Cite This Study