March 14, 2015

Chimäre

Key Points

Key points are not available for this paper at this time.

Abstract

Die Nachfrage nach Multitasking auf Grafikprozessoren (GPUs) steigt ständig, da sie zu einem der Standardkomponenten moderner Computersysteme neben traditionellen Prozessoren (CPUs) geworden sind. Präemptives Multitasking auf CPUs wird hauptsächlich durch Kontextwechsel unterstützt. Allerdings verursacht dieselbe Präemptionstaktik erhebliche Overheads aufgrund des großen Kontexts in GPUs. Der Overhead kommt in zwei Dimensionen: Ein präemptierender Kernel leidet unter einer langen Präemptionslatenz, und der Systemdurchsatz geht während des Wechsels verloren. Ohne präzise Kontrolle über den großen Präemptionsoverhead hat Multitasking auf GPUs wenig Nutzen für Anwendungen mit strengen Latenzanforderungen. In diesem Papier schlagen wir Chimäre vor, einen kollaborativen Präemptionansatz, der den Overhead für Multitasking auf GPUs präzise steuern kann. Chimäre führt zunächst das Streaming-Multiprozessor (SM) Flush ein, das einen SM sofort präemptieren kann, indem es idempotente Ausführung erkennt und ausnutzt. Chimäre nutzt das Flush in Zusammenarbeit mit zwei zuvor vorgeschlagenen Präemptionstechniken für GPUs, nämlich Kontextwechsel und Entwässerung, um den Durchsatzoverhead zu minimieren und gleichzeitig eine erforderliche Präemptionslatenz zu erreichen. Auswertungen zeigen, dass Chimäre die Frist nur für 0,2 % der Präemptionsanfragen überschreitet, wenn eine Präemptionslatenzeinschränkung von 15 µs verwendet wird. Für mehrprogrammierte Arbeitslasten kann Chimäre die durchschnittliche normalisierte Durchlaufzeit um das 5,5-fache und den Systemdurchsatz um 12,2 % verbessern.

KI fragen

Bookmark