January 28, 2022Open Access

SHAP Posicional (PoSHAP) para la interpretación de modelos de aprendizaje automático entrenados a partir de secuencias biológicas

Puntos clave

Los puntos clave no están disponibles para este artículo en este momento.

Resumen

El aprendizaje automático con redes neuronales artificiales multicapa, también conocido como "aprendizaje profundo", es efectivo para hacer predicciones biológicas. Sin embargo, la interpretación de modelos es un desafío, especialmente para datos de entrada secuenciales utilizados con arquitecturas de red neuronal recurrente. Aquí, introducimos un marco llamado "SHAP Posicional" (PoSHAP) para interpretar modelos entrenados a partir de secuencias biológicas utilizando Explicaciones Aditivas de SHapley (SHAP) para generar interpretaciones de modelos posicionales. Demostramos esto utilizando tres modelos de regresión de memoria a corto y largo plazo (LSTM) que predicen propiedades de péptidos, incluyendo afinidad de unión a complejos principales de histocompatibilidad (MHC), y sección transversal de colisión (CCS) medida mediante espectrometría de movilidad iónica. La interpretación de estos modelos con PoSHAP reprodujo motivos de unión de péptidos de clase I de MHC (Mamu-A1*001 de macaco rhesus y A*11:01 en humanos), reflejó propiedades conocidas de CCS de péptidos y proporcionó nuevas ideas sobre las dependencias interposicionales de las interacciones de aminoácidos. PoSHAP debería tener una utilidad generalizada para interpretar una variedad de modelos entrenados a partir de secuencias biológicas.

Leer artículo completoexternamente

Me gusta

Guardar

Ver artículo completo