Los puntos clave no están disponibles para este artículo en este momento.
Merrimac utiliza arquitectura de transmisión y redes de interconexión avanzadas para ofrecer un orden de magnitud más rendimiento por costo unitario que los computadoras científicas basadas en clúster construidas con la misma tecnología. Organizar la computación en flujos y explotar la localidad resultante utilizando una jerarquía de registros permite que una arquitectura de transmisión reduzca el ancho de banda de memoria requerido por aplicaciones representativas en un orden de magnitud o más. Por lo tanto, un nodo de procesamiento con un ancho de banda fijo (costoso) puede soportar un orden de magnitud más de unidades aritméticas (baratas). Esto, a su vez, permite alcanzar un nivel dado de rendimiento con menos nodos (una máquina de 1-PFLOPS, por ejemplo, con solo 8, 192 nodos), lo que resulta en mayor fiabilidad y una gestión del sistema más simple. Esbozamos el diseño de Merrimac, una computadora científica de transmisión que se puede escalar desde una estación de trabajo de 20K 2 TFLOPS hasta un supercomputador de 20M 2 PFLOPS y presentamos los resultados de algunos experimentos iniciales de aplicación en esta arquitectura.
Dally et al. (Sat,) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: