Ftrans

Puntos clave

Los puntos clave no están disponibles para este artículo en este momento.

Resumen

En el procesamiento del lenguaje natural (NLP), se propuso la arquitectura "Transformer" como el primer modelo de transducción que depende completamente de mecanismos de autoatención sin utilizar redes neuronales recurrentes (RNNs) alineadas por secuencia o convolución, logrando mejoras significativas para tareas de secuencia a secuencia. La introducción de cálculos intensivos y almacenamiento de estas representaciones de lenguaje preentrenadas ha impedido su popularidad en dispositivos con limitaciones de computación y memoria. La matriz de puertas programables en campo (FPGA) se utiliza ampliamente para acelerar algoritmos de aprendizaje profundo debido a su alto paralelismo y baja latencia. Sin embargo, los modelos entrenados siguen siendo demasiado grandes para acomodarse a una arquitectura FPGA. En este documento, proponemos un marco de aceleración eficiente, Ftrans, para representaciones de lenguaje a gran escala basadas en transformadores. Nuestro marco incluye una representación de pesos basada en matrices circulantes mejoradas (BCM) para permitir la compresión del modelo en representaciones de lenguaje a gran escala a nivel de algoritmo con poca degradación de precisión, y un diseño de aceleración a nivel arquitectónico. Los resultados experimentales muestran que nuestro marco propuesto reduce significativamente el tamaño del modelo de los modelos de NLP hasta 16 veces. Nuestro diseño FPGA logra una mejora de 27.07× y 81 × en rendimiento y eficiencia energética en comparación con CPU, y hasta 8.80× de mejora en eficiencia energética en comparación con GPU.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Bingbing Li

Jilin University

Santosh Pandey

Rutgers, The State University of New Jersey

Haowen Fang

Shanghai University

Actions

Institutions

Oak Ridge National Laboratory

Syracuse University

The University of Texas at San Antonio

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Cite this study

Li et al. (Fri,) estudiaron esta cuestión.

synapsesocial.com/papers/6a0efeb525c30b2cc7fa049e — DOI: https://doi.org/10.1145/3370748.3406567

Also consider

Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context:

Supervised Domain Enablement Attention for Personalized Domain Classification· 2018 · 10 citations
Mathematics of the Discrete Fourier Transform (DFT) with Audio Applications· 2007 · 218 citations
Learning Word Vectors for Sentiment Analysis· 2011 · 3,298 citations
Automatic differentiation in PyTorch· 2017 · 11,124 citations
Simple Attention-Based Representation Learning for Ranking Short Social Media Posts· 2019 · 3 citations

Also consider

Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context:

Supervised Domain Enablement Attention for Personalized Domain Classification· 2018 · 10 citations
Mathematics of the Discrete Fourier Transform (DFT) with Audio Applications· 2007 · 218 citations
Learning Word Vectors for Sentiment Analysis· 2011 · 3,298 citations
Automatic differentiation in PyTorch· 2017 · 11,124 citations
Simple Attention-Based Representation Learning for Ranking Short Social Media Posts· 2019 · 3 citations

Ftrans

Puntos clave

Resumen

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider

Also consider