في هذه الورقة، تم اقتراح تقنية جديدة لضغط الصوت غير المفقود، تستفيد من تقنية التحكم في معامل التحويلة المميزة (DCT) المستندة إلى عتبة الطاقة، ونموذج ضغط الشبكة العصبية المستند إلى XOR، ونموذج CNN. في البداية، يتم تطبيق التحويلة المميزة على إشارة الصوت المدخلة لتحقيق ضغط طاقة أفضل، متبوعًا بتحويل معاملات DCT المختارة إلى تيار ثنائي مضغوط. بعد ذلك، يتم تمرير هذا التيار الثنائي إلى نموذجين محسنين يستندان إلى التنبؤ: نموذج XOR ونموذج CNN لمزيد من الضغط. يتم معالجة التيار الثنائي أولاً بواسطة نموذج الشبكة العصبية لعملية XOR، ثم يتم تغذية الناتج الناتج إلى نموذج CNN لتقليل أبعاد البيانات وتوليد بيانات صوت مضغوطة. يتم تحليل نتائج المحاكاة باستخدام مقاييس إحصائية وقوة مختلفة ومقارنتها بالأساليب الحالية.
درس موندال وآخرون (السبت) هذا السؤال.