Key points are not available for this paper at this time.
تمتلك الشبكات العصبية العميقة المتطورة (DNNs) مئات الملايين من الاتصالات وتكون كثيفة من حيث الحوسبة والذاكرة، مما يجعل من الصعب نشرها على الأنظمة المضمنة التي تملك موارد أجهزة محدودة وميزانيات طاقة. بينما يساعد العتاد المخصص في الحوسبة، فإن استرجاع الأوزان من DRAM يكلف أكثر بمقدار مرتبتين عشريتين من عمليات ALU، ويسيطر على الطاقة المطلوبة. تجعل 'الضغط العميق' المقترح مسبقًا إمكانية تكييف DNNs كبيرة (AlexNet وVGGNet) بالكامل في SRAM على الشريحة. يتم تحقيق هذا الضغط من خلال تقليم الاتصالات الزائدة ولجعل عدة اتصالات تشترك في نفس الوزن. نقترح محرك استدلال فعال في الطاقة (EIE) يقوم بإجراء الاستدلال على نموذج الشبكة المضغوط هذا ويعجل من عملية ضرب المصفوفات المتناثرة الناتجة مع مشاركة الأوزان. الانتقال من DRAM إلى SRAM يمنح EIE توفيرًا للطاقة يبلغ 120 ضعفًا؛ استغلال الكثافة يوفر 10 أضعاف؛ مشاركة الوزن تعطي 8 أضعاف؛ تخطي النشاطات الصفريّة من ReLU يوفر 3 أضعاف أخرى. عند تقييمه على تسعة معايير DNN، يكون EIE أسرع بـ 189 ضعفًا و13 ضعفًا مقارنةً بتنفيذات CPU وGPU لنفس DNN بدون ضغط. يمتلك EIE قوة معالجة تبلغ 102GOPS/ثانية تعمل مباشرة على شبكة مضغوطة، مما يعادل 3TOPS/ثانية على شبكة غير مضغوطة، ويعالج طبقات FC من AlexNet بسرعة 1.88x10⁴ إطار/ثانية مع استهلاك طاقة يبلغ 600mW فقط. إنه أكثر كفاءة في استهلاك الطاقة بمقدار 24,000 ضعف و3,400 ضعف مقارنةً بـ CPU وGPU على التوالي. مقارنةً بـ DaDianNao، يتمتع EIE بمعدل تدفق أفضل بمقدار 2.9x و19x و3x من حيث الكفاءة في الطاقة وكفاءة المساحة.
درس هان وآخرون (الخميس) هذا السؤال.