Key points are not available for this paper at this time.
Les connaissances scientifiques sur les gènes impliqués dans quelles maladies croissent rapidement, ce qui rend difficile le suivi des nouvelles publications et des ensembles de données génétiques. La base de données DISEASES vise à fournir un aperçu complet en intégrant systématiquement et en assignant des scores de confiance aux preuves des associations maladie-gène provenant de bases de données curées, d'études d'association à l'échelle du génome (GWAS) et du text mining automatique de la littérature biomédicale. Ici, nous présentons une mise à jour majeure de cette ressource, qui augmente considérablement le nombre d'associations provenant de toutes ces sources. Cela est particulièrement vrai pour les associations extraites du texte, qui ont augmenté d'au moins 9 fois à tous les seuils de confiance. Nous montrons que cette augmentation dramatique est principalement due à l'ajout d'articles en texte intégral au corpus textuel, secondairement à des améliorations des dictionnaires de maladies et de gènes utilisés pour la reconnaissance d'entités nommées, et seulement dans une très petite mesure à la croissance du nombre de résumés PubMed. DISEASES utilise maintenant également une nouvelle base de données GWAS, Target Illumination par GWAS Analytics, qui a considérablement augmenté le nombre d'associations maladie-gène dérivées de GWAS. DISEASES lui-même est également intégré dans plusieurs autres bases de données et ressources, y compris GeneCards/MalaCards, Pharos/Target Central Resource Database et l'application stringApp de Cytoscape. Toutes les données dans DISEASES sont mises à jour sur une base hebdomadaire et sont disponibles via une interface web à l'adresse https://diseases.jensenlab.org, d'où elles peuvent également être téléchargées sous des licences ouvertes. URL de la base de données : https://diseases.jensenlab.org.
Grissa et al. (Samedi) ont étudié cette question.