May 1, 2007

La arquitectura WaveScalar

Puntos clave

Los puntos clave no están disponibles para este artículo en este momento.

Resumen

La tecnología del silicio seguirá proporcionando un aumento exponencial en la disponibilidad de transistores en bruto. Sin embargo, traducir efectivamente este recurso en rendimiento de aplicaciones es un desafío abierto que los diseños superscalares convencionales no podrán cumplir. Presentamos WaveScalar como una alternativa escalable a los diseños convencionales. WaveScalar es un conjunto de instrucciones de flujo de datos y un modelo de ejecución diseñado para procesadores escalables de baja complejidad/alto rendimiento. A diferencia de las máquinas de flujo de datos anteriores, WaveScalar puede proporcionar de manera eficiente las semánticas de memoria secuencial que requieren los lenguajes imperativos. Para permitir a los programadores expresar fácilmente el paralelismo, WaveScalar admite multihilo de grano grueso al estilo pthread y multihilo de grano fino al estilo flujo de datos. Además, permite mezclar los dos estilos dentro de una aplicación o incluso dentro de una sola función. Para ejecutar programas WaveScalar, hemos diseñado una arquitectura de procesador escalable, basada en mosaicos, llamada WaveCache. A medida que se ejecuta un programa, el WaveCache mapea las instrucciones del programa en su matriz de elementos de procesamiento (PEs). Las instrucciones permanecen en sus elementos de procesamiento durante muchas invocaciones, y a medida que cambia el conjunto de trabajo de instrucciones, el WaveCache elimina instrucciones no utilizadas y asigna nuevas en su lugar. Las instrucciones se comunican directamente entre sí a través de un interconector escalable y jerárquico en chip, lo que elimina la necesidad de cables largos y comunicación por difusión. Este artículo presenta el conjunto de instrucciones de WaveScalar y evalúa una implementación simulada basada en la tecnología actual. Para aplicaciones de un solo hilo, el WaveCache logra un rendimiento comparable al de los procesadores convencionales, pero en un área menor. Para aplicaciones multihilo de grano grueso, el WaveCache logra un aumento de velocidad casi lineal con hasta 64 hilos y puede mantener de 7 a 14 operaciones de multiplicación-acumulación por ciclo en versiones de grano fino de núcleos bien conocidos. Finalmente, aplicamos ambos estilos de multihilo al equake de Spec2000 y lo aceleramos 9 veces en comparación con la versión serial.

Me gusta

Guardar