Key points are not available for this paper at this time.
Résumé La hétérogénéité clinique du cancer représente un défi majeur pour la médecine de précision. Les tailles de cohortes limitées à travers les plateformes d'essai évolutives entravent la découverte fiable de biomarqueurs. Ici, nous évaluons systématiquement comment intégrer des données provenant de quatre plateformes de transcriptomique : séquençage RNA (RNA-seq) de masse et à cellule unique (sc), NanoString et microarrays pour la modélisation prédictive dans le cancer. Nous utilisons le carcinome séreux high-grade (HGSC) d'origine tubo-ovarienne comme système modèle, car il est hautement hétérogène tant en biologie qu'en données d'essai. Nous constatons que l'utilisation du changement relatif de l'expression génique chez les patients avec des échantillons pré et post-chimiothérapie néoadjuvante appariés réduit la variabilité inter-patiente et inter-essai mais est insuffisante pour surmonter les biais spécifiques à la plateforme. Les données de microarray et de scRNA-seq présentent des biais systémiques, tandis que RNA-seq et NanoString montrent le plus de promesse pour une combinaison en une seule cohorte d'entraînement. Pour atténuer les limitations inter-essai, nous générons un nouvel ensemble de données d'échantillons de tumeur HGSC profilés à la fois avec RNA-seq et NanoString, et l'utilisons pour identifier les limites de détection et les stratégies d'harmonisation optimales. Nos approches permettent l'intégration de cohortes pour des modèles prédictifs séparés et combinés de RNA-seq et NanoString de récidive de la maladie (AUROCs du jeu de test > 0.8), validés dans des cohortes externes de microarray. Nous tirons parti des analyses basées sur des réseaux de RNA-seq à cellule unique et de masse pour fournir un contexte mécaniste pour les gènes dans les modèles prédictifs. Nos modèles indiquent que l'expression de GBP4 est un prédicteur clé de la récidive et marque le remodelage immunitaire vers la cytotoxicité. Nous fournissons un portail web interactif pour faciliter l'exploration des données et des résultats. Ces résultats guident l'harmonisation inter-essai des données transcriptomiques et permettent une modélisation prédictive améliorée dans les cancers hétérogènes. Déclaration d'importance Nous présentons un cadre pour intégrer les données de RNA-seq, NanoString, microarray et transcriptomiques à cellule unique pour la modélisation prédictive, permettant une découverte robuste de biomarqueurs dans les cancers hétérogènes et identifiant GBP4 comme un marqueur de remodelage immunitaire.
Townsend et al. (Mar) ont étudié cette question.