A predição precisa e confiável de interações de ligação anticorpo-antígeno informadas por medições de afinidade continua sendo um desafio importante na modelagem de informações químicas, com crescente preocupação sobre a confiabilidade e calibração das estimativas de confiança em predições baseadas em dados. Aqui, apresentamos o Trans-GP, uma estrutura impulsionada por sequência que integra embeddings de modelo de linguagem de proteína congelados com um classificador de processo gaussiano para realizar conjuntamente a classificação binária de ligação informada por afinidade e a calibração quantitativa de incerteza. Em múltiplos conjuntos de dados de referência, incluindo SAbDab, SKEMPI2.0 e ABbind, o Trans-GP alcança desempenho preditivo competitivo, enquanto melhora consistentemente a qualidade da calibração em relação aos modelos convencionais de rede neural. Ao fornecer estimativas de confiança probabilística bem calibradas estatisticamente, o Trans-GP apoia a triagem e priorização confiáveis de candidatos a anticorpos em fluxos de trabalho de informações químicas.
Lv et al. (Sex,) estudaram essa questão.