Los puntos clave no están disponibles para este artículo en este momento.
Las aplicaciones científicas modernas y los sistemas de supercomputación están generando grandes cantidades de datos en varios campos, lo que lleva a desafíos críticos en la huella de almacenamiento de datos y los tiempos de comunicación. Para abordar este problema, se ha adoptado ampliamente la compresión lossy por GPU con límite de error, ya que puede reducir el volumen de datos dentro de un umbral personalizado sobre la distorsión de datos. En este trabajo, proponemos un compresor lossy por GPU de límite de error ultrarrápido cuSZp. Específicamente, cuSZp calcula las recurrencias lineales con paralelismo jerárquico para fusionar la enorme computación en un solo kernel, mejorando drásticamente el rendimiento de extremo a extremo. Además, cuSZp adopta un diseño por bloques junto con una codificación de longitud fija ligera y una reordenación de bits dentro de cada bloque, de modo que logra altas relaciones de compresión y calidad de datos. Nuestros experimentos en la GPU NVIDIA A100 con 6 conjuntos de datos científicos representativos demuestran que cuSZp puede lograr un rendimiento de extremo a extremo ultrarrápido (95.53x en comparación con cuSZ) junto con una alta relación de compresión y alta calidad de datos reconstruidos.
Huang et al. (Mon,) estudiaron esta cuestión.