Key points are not available for this paper at this time.
في السنوات الأخيرة، أصبحت الشبكات العصبية التلافيفية (CNNs) مُعتمَدة على نطاق واسع في مهام رؤية الكمبيوتر. لقد تم استكشاف معالجات FPGA بشكل كافٍ كمعجل هاردوير واعد لـ CNNs نظرًا لأدائها العالي وكفاءتها في استهلاك الطاقة وقدرتها على إعادة التشكيل. ومع ذلك، غالبًا ما تكون الحلول السابقة على معالجات FPGA التي تستند إلى الخوارزمية التلافيفية التقليدية مقيدة بقدرة المعالجة لمعالجات FPGA (على سبيل المثال، عدد DSPs). في هذه الورقة، نوضح أن خوارزمية وينوجراد السريعة يمكن أن تقلل بشكل دراماتيكي من التعقيد الحسابي، وتحسن أداء CNNs على معالجات FPGA. نقترح أولاً هيكلًا جديدًا لتنفيذ خوارزمية وينوجراد على معالجات FPGA. يعتمد تصميمنا على بنية خط الذاكرة لإعادة استخدام بيانات خريطة الميزات بفعالية بين البلاطات المختلفة. كما قمنا بفعالية بتدفق محرك PE الخاص بوينوجراد وبدء عدة PEs من خلال التوازي. في الوقت نفسه، يوجد فضاء تصميم معقد للاستكشاف. نقترح نموذجًا تحليليًا لتوقع استخدام الموارد والتفكير حول الأداء. ثم نستخدم النموذج لتوجيه استكشاف سريع لفضاء التصميم. تُظهر التجارب باستخدام أحدث تقنيات CNNs أفضل أداء وكفاءة طاقة على معالجات FPGA. حققنا متوسط 1006.4 GOP/s لطبقات التلافيف و 854.6 GOP/s للإجمالي AlexNet ومتوسط 3044.7 GOP/s لطبقات التلافيف و 2940.7 GOP/s للإجمالي VGG16 على منصة Xilinx ZCU102.
درس لو وآخرون (السبت) هذا السؤال.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: