Key points are not available for this paper at this time.
PSI-BLAST é um programa iterativo para pesquisar um banco de dados em busca de proteínas com similaridade distante a uma sequência de consulta. Investigamos mais de uma dúzia de modificações nos métodos utilizados no PSI-BLAST, com o objetivo de melhorar a precisão na identificação de correspondências verdadeiramente positivas. Para avaliar o desempenho, utilizamos um conjunto de 103 consultas para as quais os verdadeiros positivos em leveduras foram anotados por especialistas humanos, e uma medida popular de precisão de recuperação (ROC) que pode ser normalizada para assumir valores entre 0 (pior) e 1 (melhor). As modificações que consideramos novas melhoram a pontuação ROC de 0,758 +/- 0,005 para 0,895 +/- 0,003. Isso não inclui os benefícios de quatro modificações que incluímos na versão 'base', embora não tenham sido implementadas na versão 2.0 do PSI-BLAST. A melhoria na precisão foi confirmada em um pequeno segundo conjunto de testes. Este teste envolveu a análise de três famílias de proteínas com listas curadas de verdadeiros positivos do banco de dados de proteínas não redundantes. A modificação que representa a maioria da melhoria é o uso, para cada sequência do banco de dados, de um sistema de pontuação específico de posição ajustado à composição de aminoácidos daquela sequência. O uso de estatísticas baseadas em composição é particularmente benéfico para aplicações automatizadas em larga escala do PSI-BLAST.
A. A. Schaffer (Sun,) estudou essa questão.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: