Key points are not available for this paper at this time.
الملخص يتناول هذا المستند بعض المشاكل الأساسية في التعلم الآلي (ML)، مثل التكاليف العالية للحوسبة والطاقة المرتبطة بتنفيذها على أجهزة إنترنت الأشياء. يهدف إلى دراسة وتحليل الأداء والكفاءة للتكميم كطريقة تحسين، فضلاً عن إمكانية تدريب نماذج التعلم الآلي مباشرة على جهاز إنترنت الأشياء. ينطوي التكميم على تقليل دقة أوزان النموذج وتنشيطاته مع الحفاظ على مستويات دقة مقبولة. باستخدام شبكات تمثيلية للتعرف على الوجه تم تطويرها باستخدام TensorFlow وTensorRT، يتم استخدام التكميم بعد التدريب وتدريب المعرفة المعروفة بالتكميم لتقليل عبء الحوسبة وتحسين كفاءة الطاقة. تم إجراء التجربة الحاسوبية على كمبيوتر عام يحتوي على معالج Intel i7-1260P وبطاقة رسومات NVIDIA RTX 3080 المستخدمة كمسار تسريع. بالإضافة إلى ذلك، تم استخدام NVIDIA Jetson AGX Orin كمثال لجهاز إنترنت الأشياء. نقوم بتحليل جدوى التدريب على جهاز إنترنت الأشياء، وتأثير تحسين التكميم على نماذج التدريب المعروفة، ونقيم الاختلافات بين التكميم بعد التدريب وتدريب المعرفة المعروفة بالتكميم في مثل هذه الشبكات على أجهزة مختلفة. علاوة على ذلك، تدرس الأداء والكفاءة لمسرع الاستدلال من NVIDIA (مسرع التعلم العميق - DLA، في نسخته 2.0) المتاح في بنية Jetson Orin. توصلنا إلى أن جهاز Jetson قادر على القيام بالتدريب بشكل مستقل. يمكن لجهاز إنترنت الأشياء تحقيق أداء استدلال مشابه لذلك الخاص بالمعالج الأقوى، بفضل عملية التحسين، مع كفاءة طاقة أفضل. أظهر التكميم بعد التدريب أداءً أفضل، بينما أثبت تدريب المعرفة المعروفة بالتكميم كفاءة طاقة أعلى. ومع ذلك، نظرًا لأن المسرع لا يمكنه تنفيذ بعض طبقات النماذج، فإن استخدام DLA يؤثر سلبًا على نتائج الأداء والكفاءة.
درس هيرنانديز وآخرون (ثلاثاء) هذا السؤال.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: