Los puntos clave no están disponibles para este artículo en este momento.
ANTECEDENTES: La repetición en tándem corta (STR), o "microsatélite", es un tramo de ADN en el cual un motivo específico (típicamente < 10 pares de bases) se repite múltiples veces. Las STRs son abundantes en todo el genoma humano, y las expansiones de repeticiones específicas pueden estar asociadas con enfermedades humanas. La secuenciación de lectura larga, junto con herramientas bioinformáticas, permite la estimación de recuentos de repeticiones para las STRs. Sin embargo, con la excepción de algunas STRs relevantes para enfermedades bien conocidas, los rangos normales de recuento de repeticiones para la mayoría de las STRs en poblaciones humanas no se conocen bien, lo que impide la priorización de STRs que pueden estar asociadas con enfermedades humanas. RESULTADOS: En este estudio, ampliamos una herramienta computacional, RepeatHMM, para inferir rangos normales de 432,604 STRs utilizando 21 conjuntos de datos de secuenciación de lectura larga sobre genomas humanos, y construimos una base de datos a escala genómica llamada RepeatHMM-DB con rangos normales de repeticiones para estas STRs. La evaluación en 13 repeticiones bien conocidas muestra que los rangos de repetición inferidos proporcionan una buena estimación de los rangos de repetición reportados en la literatura a partir de estudios a escala poblacional. Esta base de datos, junto con una herramienta de estimación de expansión de repeticiones como RepeatHMM, permite el escaneo a escala genómica de regiones de repetición en genomas recién secuenciados para identificar expansiones de repeticiones relevantes para enfermedades. Como estudio de caso utilizando RepeatHMM-DB, evaluamos las repeticiones CAG de ATXN3 en 20 pacientes con ataxia espinocerebelosa tipo 3 (SCA3) y 5 individuos no afectados, clasificando correctamente a cada individuo. CONCLUSIONES: En resumen, RepeatHMM-DB puede facilitar la priorización e identificación de STRs relevantes para enfermedades a partir de datos de secuenciación de lectura larga de genomas completos en pacientes con enfermedades no diagnosticadas. RepeatHMM-DB está incorporado en RepeatHMM y está disponible en https://github.com/WGLab/RepeatHMM.
Liu et al. (Tue,) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: