April 1, 2017

تقييم الخوارزميات السريعة للشبكات العصبية التلافيفية على معالجات FPGA

Key Points

Key points are not available for this paper at this time.

Abstract

في السنوات الأخيرة، أصبحت الشبكات العصبية التلافيفية (CNNs) مُعتمَدة على نطاق واسع في مهام رؤية الكمبيوتر. لقد تم استكشاف معالجات FPGA بشكل كافٍ كمعجل هاردوير واعد لـ CNNs نظرًا لأدائها العالي وكفاءتها في استهلاك الطاقة وقدرتها على إعادة التشكيل. ومع ذلك، غالبًا ما تكون الحلول السابقة على معالجات FPGA التي تستند إلى الخوارزمية التلافيفية التقليدية مقيدة بقدرة المعالجة لمعالجات FPGA (على سبيل المثال، عدد DSPs). في هذه الورقة، نوضح أن خوارزمية وينوجراد السريعة يمكن أن تقلل بشكل دراماتيكي من التعقيد الحسابي، وتحسن أداء CNNs على معالجات FPGA. نقترح أولاً هيكلًا جديدًا لتنفيذ خوارزمية وينوجراد على معالجات FPGA. يعتمد تصميمنا على بنية خط الذاكرة لإعادة استخدام بيانات خريطة الميزات بفعالية بين البلاطات المختلفة. كما قمنا بفعالية بتدفق محرك PE الخاص بوينوجراد وبدء عدة PEs من خلال التوازي. في الوقت نفسه، يوجد فضاء تصميم معقد للاستكشاف. نقترح نموذجًا تحليليًا لتوقع استخدام الموارد والتفكير حول الأداء. ثم نستخدم النموذج لتوجيه استكشاف سريع لفضاء التصميم. تُظهر التجارب باستخدام أحدث تقنيات CNNs أفضل أداء وكفاءة طاقة على معالجات FPGA. حققنا متوسط 1006.4 GOP/s لطبقات التلافيف و 854.6 GOP/s للإجمالي AlexNet ومتوسط 3044.7 GOP/s لطبقات التلافيف و 2940.7 GOP/s للإجمالي VGG16 على منصة Xilinx ZCU102.

Bookmark

تقييم الخوارزميات السريعة للشبكات العصبية التلافيفية على معالجات FPGA

Key Points

Abstract

Cite This Study

Also Consider

Also Consider