Los puntos clave no están disponibles para este artículo en este momento.
Los estudios de expresión génica conectan la información del ADN con la información sobre rasgos al descomponer las vías bioquímicas en componentes intermedios entre genotipo y fenotipo. Estos estudios abren nuevas avenidas para identificar genes de enfermedades complejas y biomarcadores para el diagnóstico de enfermedades, así como para evaluar la eficacia y toxicidad de fármacos. Sin embargo, la mayoría de los métodos analíticos aplicados a los datos de expresión génica no son eficientes para la identificación de biomarcadores y el diagnóstico de enfermedades. En este documento, proponemos un marco general para incorporar la selección de características (genes) en el reconocimiento de patrones en el proceso de identificación de biomarcadores. Utilizando este marco, desarrollamos tres envolturas de características que buscan en el espacio de subconjuntos de características usando el error de clasificación como medida de calidad para un subconjunto de características particular que está "envuelto": análisis discriminante lineal, regresión logística y máquinas de vectores de soporte. Para llevar a cabo este proceso de búsqueda computacionalmente intensivo de manera efectiva, empleamos algoritmos de búsqueda secuencial hacia adelante y búsqueda secuencial hacia adelante flotante. Para evaluar el rendimiento de la selección de características para la identificación de biomarcadores, hemos aplicado los métodos propuestos a tres conjuntos de datos. Los resultados preliminares demuestran que se puede alcanzar una precisión de clasificación muy alta mediante la identificación de clasificadores compuestos con varios biomarcadores.
Xiong et al. (Jue,) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: