La secuenciación de ARN unicelular (scRNA-seq) permite la medición de la expresión génica a nivel transcriptómico con precisión unicelular, profundizando así nuestra comprensión de la heterogeneidad celular. Sin embargo, la alta dimensionalidad y la dispersión de los datos de scRNA-seq dificultan los análisis posteriores (como la agrupación celular y la inferencia de trayectorias), y aprender representaciones embebidas efectivas de los datos se ha convertido en un aspecto clave en el análisis de datos scRNA-seq. Presentamos scDEBGCL, un nuevo algoritmo de incrustación profunda basado en aprendizaje contrastivo de grafos bipartitos. scDEBGCL aprovecha la Descomposición en Valores Singulares (SVD) para la mejora del grafo bipartito e integra el aprendizaje contrastivo de grafos, la reconstrucción de grafos y la reconstrucción de datos para aprender conjuntamente representaciones embebidas de baja dimensión de células, que se utilizan para tareas posteriores como agrupación celular, inferencia de trayectorias e identificación de genes marcadores. Específicamente, scDEBGCL primero convierte la matriz de expresión génica en un grafo bipartito célula-gen y aplica SVD a este grafo bipartito para su mejora. Esta estrategia preserva efectivamente las interacciones globales célula-gen y facilita el aprendizaje de señales sinérgicas globales dentro de los datos. Para capturar mejor las representaciones celulares discriminativas, scDEBGCL realiza aprendizaje contrastivo entre el grafo mejorado y el grafo bipartito original. Luego, scDEBGCL integra la pérdida de aprendizaje contrastivo, la pérdida de reconstrucción del grafo bipartito y la pérdida de reconstrucción basada en la distribución ZINB para optimizar conjuntamente y aprender las representaciones de baja dimensión de las células para análisis posteriores como agrupación celular, inferencia de trayectorias celulares e identificación de genes marcadores. Los resultados experimentales demuestran que scDEBGCL es un marco GCL útil para incrustación profunda en datos scRNA-seq, proporcionando una base confiable para diversos análisis posteriores.
Wáng et al. (mar,) estudiaron esta cuestión.