Key points are not available for this paper at this time.
Die sparse-sparse Matrixmultiplikation (SpGEMM) ist ein Berechnungskernel, der in zahlreichen Anwendungsbereichen wie Datenanalyse, Grafikverarbeitung und wissenschaftlichem Rechnen weit verbreitet ist. In dieser Arbeit schlagen wir MatRaptor vor, einen neuartigen SpGEMM-Beschleuniger, der hohe Leistung und hohe Ressourceneffizienz bietet. Im Gegensatz zu herkömmlichen Methoden, die innere oder äußere Produkte als Metaoperation für die Matrixmultiplikation verwenden, basiert unser Ansatz auf zeilenweiser Produktberechnung, was einen besseren Kompromiss hinsichtlich der Datenwiederverwendung und der Anforderungen an den On-Chip-Speicher bietet und eine höhere Leistung für große spärliche Matrizen erreicht. Wir schlagen außerdem ein neues hardwarefreundliches sparsames Speicherformat vor, das es parallelen Rechenmaschinen ermöglicht, auf die spärlichen Daten in einer vektorisierten und stromartigem Weise zuzugreifen, was zu einer hohen Auslastung der Speicherbandbreite führt. Wir prototypisieren und simulieren unsere Beschleunigerarchitektur mit gem5 auf einer vielfältigen Anzahl von Matrizen. Unsere Experimente zeigen, dass MatRaptor einen Geschwindigkeitszuwachs von 129,2× gegenüber einer einsträngigen CPU, 8,8× gegenüber einer GPU und 1,8× gegenüber dem derzeit besten SpGEMM-Beschleuniger (OuterSPACE) erreicht. MatRaptor hat außerdem einen um 7,2× geringeren Energieverbrauch und eine um 31,3× kleinere Fläche im Vergleich zu OuterSPACE.
Srivastava et al. (Thu,) haben diese Frage untersucht.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: