Los puntos clave no están disponibles para este artículo en este momento.
Los sistemas en chip (SoC) habilitados por inteligencia artificial para el Internet de las Cosas (AI-IoT) que están emergiendo para la realidad aumentada, la atención médica personalizada y la nanorobótica necesitan ejecutar muchas tareas diversas dentro de un límite de potencia de unas pocas decenas de mW sobre un amplio rango de condiciones de operación: inferencia de redes neuronales profundas (DNN) intensiva en computo pero fuertemente cuantizada, así como procesamiento de señales y control que requieren punto flotante de alta precisión. Presentamos MARSELLUS, un SoC heterogéneo totalmente digital para nodos finales AI-IoT fabricado en FDX de 22 nm de GlobalFoundries que combina: 1) un clúster de propósito general de 16 núcleos de procesamiento de señales digitales (DSP) RISC-V ajustados para la ejecución de una diversidad de cargas de trabajo que explotan extensiones aritméticas de 4 y 2 bits (XpulpNN), combinadas con operaciones de acumulación de multiplicación fusionada (MAC) y operaciones de CARGA y soporte de punto flotante; 2) un motor binario reconfigurable de 2 a 8 bits (RBE) para acelerar las convoluciones A3 3 y A1 1 (punto a punto) en DNNs; 3) un conjunto de bloques de monitoreo en chip (OCM) conectados a un generador de sesgo de cuerpo adaptativo (ABB) y un bucle de control de hardware, permitiendo la adaptación en tiempo real de los voltajes de umbral de los transistores. MARSELLUS logra hasta 180 Gop/s o 3.32 Top/s/W en aritmética de precisión de 2 bits en software, y hasta 637 Gop/s o 12.4 Top/s/W en capas de DNN aceleradas por hardware.
Conti et al. (Tue,) estudiaron esta cuestión.