Key points are not available for this paper at this time.
MOTIVAÇÃO: Kalign é um programa eficiente de alinhamento múltiplo de sequências (MSA) capaz de alinhar milhares de sequências de proteínas ou nucleotídeos. No entanto, os problemas de alinhamento atuais envolvendo um grande número de sequências estão ultrapassando as especificações de design originais do Kalign. Aqui, apresentamos uma versão completamente reescrita e atualizada para atender aos desafios de alinhamento atuais e futuros. RESULTADOS: Kalign agora utiliza uma versão acelerada por SIMD do algoritmo bit-paralelo de Gene Myers para estimar distâncias pareadas, adota uma estratégia de incorporação de sequência e o algoritmo K-means bissecional para construir rapidamente árvores-guia para milhares de sequências. A nova versão mantém alta precisão de alinhamento tanto em alinhamentos de proteínas quanto de nucleotídeos e se escala melhor do que outras ferramentas de MSA. DISPONIBILIDADE: O código-fonte do Kalign e o código para reproduzir os resultados podem ser encontrados aqui: https://github.com/timolassmann/kalign.
Timo Lassmann (Qui,) estudou essa questão.