Key points are not available for this paper at this time.
Este artigo apresenta um novo algoritmo para o cálculo de gradientes de energia analíticos da teoria de perturbação de Møller Plesset de segunda ordem dentro da aproximação de Resolução da Identidade (RI-MP2), projetado para alcançar alto desempenho em clusters de multi-GPU. O algoritmo utiliza GPUs para todas as principais etapas do cálculo, incluindo geração de integrais, formação de todos os tensores intermediários necessários, solução da equação do vetor Z e acumulação de gradientes. A implementação no pacote de software EXtreme Scale Electronic Structure System (EXESS) inclui um sistema de agendamento multi-stream altamente eficiente e adaptado para ocultar latências de transferência de dados CPU-GPU e permite que nós com 8 GPUs A100 operem a mais de 80% do desempenho teórico de pico em ponto flutuante. A análise de desempenho comparativa mostra uma redução significativa no tempo computacional em relação aos métodos tradicionais baseados em CPU de múltiplos núcleos, com nossa abordagem alcançando até 95 vezes mais velocidade em comparação com o desempenho de nó único de softwares estabelecidos como Q-Chem e ORCA. Além disso, demonstramos que emparelhar nossa implementação com a estrutura de fragmentação molecular em EXESS pode reduzir drasticamente a escalabilidade computacional dos cálculos de gradientes RI-MP2 de quintica para sub-quadrática, permitindo economias substanciais adicionais no tempo de execução enquanto mantém alta precisão numérica nos gradientes resultantes.
Stocks et al. (Mon,) estudaram esta questão.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: