Key points are not available for this paper at this time.
As redes neurais profundas (DNNs) são atualmente amplamente utilizadas em muitas aplicações de inteligência artificial (IA), incluindo visão computacional, reconhecimento de voz e robótica. Embora as DNNs proporcionem precisão de ponta em muitas tarefas de IA, isso vem à custa de alta complexidade computacional. Assim, técnicas que possibilitam o processamento eficiente de DNNs para melhorar a eficiência energética e a taxa de transferência, sem sacrificar a precisão da aplicação ou aumentar o custo do hardware, são críticas para a ampla implementação de DNNs em sistemas de IA. Este artigo tem como objetivo fornecer um tutorial abrangente e uma revisão sobre os avanços recentes em direção à meta de possibilitar o processamento eficiente de DNNs. Especificamente, ele fornecerá uma visão geral das DNNs, discutirá várias plataformas de hardware e arquiteturas que suportam DNNs e destacará as principais tendências na redução do custo computacional das DNNs, seja unicamente por meio de mudanças no design do hardware ou por meio de um design conjunto de hardware e mudanças no algoritmo da DNN. Também resumirá vários recursos de desenvolvimento que permitem que pesquisadores e praticantes comecem rapidamente neste campo e destacará métricas de benchmarking importantes e considerações de design que devem ser usadas para avaliar o número rapidamente crescente de designs de hardware de DNNs, incluindo opcionalmente codificações algorítmicas, sendo propostos na academia e na indústria. O leitor levará os seguintes conceitos deste artigo: entender as principais considerações de design para DNNs; ser capaz de avaliar diferentes implementações de hardware de DNNs com benchmarks e métricas de comparação; entender as compensações entre várias arquiteturas e plataformas de hardware; ser capaz de avaliar a utilidade de várias técnicas de design de DNN para processamento eficiente; e entender as tendências e oportunidades de implementação recentes.
Sze et al. (Mon,) estudaram esta questão.