Key points are not available for this paper at this time.
في هذه المقالة، يتم اقتراح نموذج شبكة عصبية تلافيفية متعددة الطبقات (ResNet-18) وشبكات الذاكرة طويلة وقصيرة المدى (LSTM) للتعرف على الإيماءات الديناميكية. يعتمد مجموعة بيانات Soli على إشارات الإيماءات الديناميكية التي تم جمعها بواسطة رادار المليمتر الموجي. كأداة استشعار إيماءات، يتمتع رادار Soli بدقة موضعية عالية ويمكنه التعرف على الحركات الصغيرة، لتحقيق الهدف النهائي للتفاعل بين الإنسان والحاسوب (HCI). تستخدم مجموعة من صور دوبلر ذات السرعة والنطاق تم تحويلها من الإشارة الأصلية كمدخلات للنموذج. بشكل خاص، يتم استخدام ResNet-18 لاستخراج ميزات مكانية أعمق ولحل مشكلة انطفاء أو انفجار التدرج. تُستخدم LSTM لاستخراج الميزات الزمنية وحل مشكلة الاعتماد على الوقت الطويل. تم تنفيذ النموذج على مجموعة بيانات Soli لتجربة التعرف على الإيماءات الديناميكية، حيث حصلت دقة التعرف على الإيماءات على 92.55%. أخيرًا، تمت مقارنة النموذج مع الطرق التقليدية. تُظهر النتائج أن النموذج المقترح في هذا البحث يحقق دقة أعلى في التعرف على الإيماءات الديناميكية. تم التحقق من صحة النموذج من خلال التجارب.
درس زانغ وآخرون (الثلاثاء) هذا السؤال.