Key points are not available for this paper at this time.
L'efficacité et l'efficience des réseaux de neurones convolutionnels (CNN) ont été prouvées dans un large éventail d'applications d'apprentissage automatique. Cependant, la complexité computationnelle élevée des CNN présente un défi critique pour leur adoption plus large dans des scénarios en temps réel et économes en énergie. Les FPGA sont appelés à jouer un rôle significatif pour le calcul haute performance et économe en énergie des CNN pour les domaines mobiles (par exemple, UAV, voitures autonomes et appareils IoT) et d'informatique en nuage. Cependant, la mise en œuvre d'un système CNN efficace sur des FPGA de manière efficace reste problématique. Les FPGA basés sur le cloud actuels, avec des contraintes de conception uniques et des caractéristiques architecturales, augmentent encore les défis. Pour relever ces défis, nous proposons une nouvelle chaîne d'outils automatisée open-source appelée Cloud-DNN. Notre chaîne d'outils prend en entrée des modèles CNN entraînés spécifiés dans Caffe, effectue un ensemble de transformations et mappe le modèle à un FPGA basé sur le cloud. Cloud-DNN peut améliorer considérablement la productivité globale de conception des CNN sur FPGA tout en satisfaisant les exigences computationnelles émergentes. Notre conception fournit une solution alternative par rapport à d'autres options basées sur le cloud (par exemple, GPU ou TPU) tout en offrant des inférences DNN flexibles et haute performance. Les caractéristiques uniques de Cloud-DNN incluent les optimisations avec des caractéristiques de plateforme cloud et le support d'une mise en œuvre plus facile et rationalisée. Les résultats expérimentaux montrent jusqu'à 104,55 fois d'amélioration des performances par rapport à l'implémentation CPU et une utilisabilité, flexibilité et qualité comparables par rapport à d'autres implémentations d'inférence DNN de pointe sur des FPGA autonomes.
Chen et al. (Mer,) ont étudié cette question.