Los puntos clave no están disponibles para este artículo en este momento.
Este artículo presenta un algoritmo y una implementación optimizados para calcular energías y gradientes analíticos de Hartree-Fock (RI-HF) con resolución de identidad utilizando múltiples Unidades de Procesamiento Gráfico (GPUs). El algoritmo está diseñado especialmente para simulaciones de dinámica molecular ab initio de alto rendimiento de moléculas pequeñas y medianas (10-100 átomos). Las innovaciones clave de este trabajo incluyen la explotación del paralelismo multi-GPU y un esquema de balanceo de carga que distribuye de manera eficiente las tareas computacionales entre las GPUs. Nuestra implementación también emplea técnicas para la utilización de simetría, filtrado de integrales y aprovechamiento de la esparsidad para optimizar el uso de memoria y la eficiencia computacional. Los resultados computacionales muestran que la implementación logra mejoras significativas en el rendimiento, incluido un incremento de más de 3 veces en la capacidad de AIMD de una sola GPU en comparación con los métodos RI-HF acelerados por GPU y los métodos HF tradicionales. Además, la utilización de múltiples GPUs puede proporcionar un incremento super-lineal cuando la memoria agregada adicional de la GPU permite el almacenamiento de integrales de tres centros descompuestos. Adicionalmente, informamos sobre fuertes eficiencias de escalamiento para sistemas de hasta 1000 funciones base y demostramos aplicaciones prácticas a través de extensos benchmarks de rendimiento en conjuntos de bases primarias de hasta cuádruple, alcanzando un rendimiento de punto flotante de hasta el 47\% del pico teórico en un nodo GPU 4A100.
Stocks et al. (Sun,) estudiaron esta cuestión.