Los puntos clave no están disponibles para este artículo en este momento.
Detectar con precisión relaciones evolutivas distantes entre proteínas sigue siendo un desafío continuo en bioinformática. Los métodos de búsqueda basados en la secuencia primaria luchan por detectar con precisión homología entre secuencias con menos del 20% de identidad de aminoácidos. Las estrategias basadas en perfiles y estructuras extienden las capacidades de búsqueda sensible en esta zona crepuscular de similitud de secuencias, pero requieren pasos de preprocesamiento lentos. Recientemente, las incrustaciones de toda la proteína y posicionales de redes neuronales profundas han mostrado promesa para proporcionar comparación y anotación de secuencias sensibles a largas distancias evolutivas. Las incrustaciones son generalmente más rápidas de calcular que los perfiles y estructuras predichas, pero aún sufren varios inconvenientes relacionados con la capacidad de las incrustaciones de toda la proteína para discriminar la homología a nivel de dominio, y el tamaño de la base de datos y la velocidad de búsqueda de los métodos que utilizan incrustaciones posicionales. En este trabajo, mostramos que las incrustaciones posicionales de baja dimensionalidad pueden utilizarse directamente en algoritmos de búsqueda local optimizados para la velocidad. Como prueba de concepto, utilizamos el modelo ESM2 3B para convertir secuencias primarias directamente en el alfabeto de interacción 3D (3Di) o perfiles de aminoácidos y utilizamos estas incrustaciones como entrada para los algoritmos de búsqueda altamente optimizados Foldseek, HMMER3 y HH-suite. Nuestros resultados sugieren que las incrustaciones posicionales tan pequeñas como un solo byte pueden proporcionar información suficiente para mejorar dramáticamente la sensibilidad en comparación con las búsquedas de secuencias de aminoácidos sin sacrificar la velocidad de búsqueda.
Johnson et al. (Vier,) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: