Key points are not available for this paper at this time.
Modelle der künstlichen Intelligenz (KI), die über Milliarden von Parametern verfügen, können eine hohe Genauigkeit über eine Reihe von Aufgaben hinweg erzielen, aber sie verschärfen die schlechte Energieeffizienz von herkömmlichen Prozessoren wie Grafikprozessoren oder zentralen Verarbeitungseinheiten. Analoge In-Memory-Computing (analog-KI) kann eine bessere Energieeffizienz bieten, indem Matrix-Vektor-Multiplikationen parallel auf ‚Speicherfliesen‘ durchgeführt werden. Allerdings muss analog-KI noch die Software-äquivalente Genauigkeit (SWeq) bei Modellen demonstrieren, die viele solcher Fliesen erfordern und eine effiziente Kommunikation der Aktivierungen des neuronalen Netzwerks zwischen den Fliesen ermöglichen. Hier präsentieren wir einen analog-KI-Chip, der 35 Millionen Phasenwechsel-Speichergeräte über 34 Fliesen kombiniert, massive parallele inter-fliesen Kommunikation und analoge, energieeffiziente Peripherieschaltung, die eine Leistung von bis zu 12,4 Tera-Operationen pro Sekunde und Watt (TOPS/W) im chipgestützten Betrieb erreichen kann. Wir demonstrieren vollständig end-to-end SWeq-Genauigkeit für ein kleines Keyword-Spotting-Netzwerk und nahezu SWeq-Genauigkeit bei dem viel größeren MLPerf rekurrenten neuronalen Netztransducer (RNNT), mit mehr als 45 Millionen Gewichten, die auf mehr als 140 Millionen Phasenwechsel-Speichergeräte über fünf Chips abgebildet sind.
Ambrogio et al. (Mi,) untersuchten diese Frage.