Key points are not available for this paper at this time.
تعتمد مخططات توليد الموسيقى باستخدام نمذجة اللغة على مفردات من الرموز الصوتية، وعادة ما يتم تقديمها كرموز في فضاء متخفي منفصل يتم تعلمه بواسطة مشفر تلقائي. غالبًا ما يتم استخدام مقومات متعددة المراحل لإنتاج هذه الرموز، لذا يجب تكييف استراتيجية فك التشفير المستخدمة في توقع الرموز لتناسب متعددة من كتب الرموز: إما أن تقوم بنمذجة التوزيع المشترك على جميع كتب الرموز، أو ملاءمة ناتج توزيع الهامش لكتب الرموز. يتطلب نمذجة التوزيع المشترك زيادة مكلفة في عدد الخطوات الذاتية الانحدار، بينما يؤدي ملاءمة ناتج التوزيع الهامشي إلى نموذج غير دقيق ما لم تكن كتب الرموز مستقلة عن بعضها. في هذا العمل، نقدم خسارة تعزز الاستقلالية لتقنين المشفر التلقائي المستخدم كرمز في نماذج اللغة لتوليد الموسيقى. الخسارة المقترحة هي وكيل للمعلومات المتبادلة استنادًا إلى مبدأ التباين المتوسط الأقصى، وتطبق في فضاءات هيلبرت الأساسية القابلة للتكرار. معيارنا بسيط في التنفيذ والتدريب، وهو قابل للتعميم على كوديكات متعددة التدفقات الأخرى. نوضح أنها تقلل من الاعتماد الإحصائي بين كتب الرموز أثناء الترميز التلقائي. وهذا يؤدي إلى زيادة في جودة الموسيقى المولدة عند نمذجة ناتج توزيعات الهامش، بينما يتم توليد الصوت بشكل أسرع بكثير مقارنة بنموذج التوزيع المشترك.
دراسة لميرسير وآخرون (يوم الثلاثاء) تناولت هذا السؤال.