August 23, 2023Open Access

Ein analoger KI-Chip zur energieeffizienten Spracherkennung und Transkription

Key Points

Key points are not available for this paper at this time.

Abstract

Modelle der künstlichen Intelligenz (KI), die über Milliarden von Parametern verfügen, können eine hohe Genauigkeit über eine Reihe von Aufgaben hinweg erzielen, aber sie verschärfen die schlechte Energieeffizienz von herkömmlichen Prozessoren wie Grafikprozessoren oder zentralen Verarbeitungseinheiten. Analoge In-Memory-Computing (analog-KI) kann eine bessere Energieeffizienz bieten, indem Matrix-Vektor-Multiplikationen parallel auf ‚Speicherfliesen‘ durchgeführt werden. Allerdings muss analog-KI noch die Software-äquivalente Genauigkeit (SWeq) bei Modellen demonstrieren, die viele solcher Fliesen erfordern und eine effiziente Kommunikation der Aktivierungen des neuronalen Netzwerks zwischen den Fliesen ermöglichen. Hier präsentieren wir einen analog-KI-Chip, der 35 Millionen Phasenwechsel-Speichergeräte über 34 Fliesen kombiniert, massive parallele inter-fliesen Kommunikation und analoge, energieeffiziente Peripherieschaltung, die eine Leistung von bis zu 12,4 Tera-Operationen pro Sekunde und Watt (TOPS/W) im chipgestützten Betrieb erreichen kann. Wir demonstrieren vollständig end-to-end SWeq-Genauigkeit für ein kleines Keyword-Spotting-Netzwerk und nahezu SWeq-Genauigkeit bei dem viel größeren MLPerf rekurrenten neuronalen Netztransducer (RNNT), mit mehr als 45 Millionen Gewichten, die auf mehr als 140 Millionen Phasenwechsel-Speichergeräte über fünf Chips abgebildet sind.

KI fragen

Bookmark

View Full Paper