Key points are not available for this paper at this time.
نموذج الانتشار قادر على إنتاج صور فوتوغرافية واقعية تجمع بين عناصر من المحتمل أن لا تظهر معًا في مجموعة التدريب، مما يظهر القدرة على التعميم التركيب. ومع ذلك، لا يزال الآلية الدقيقة للتأليف وكيفية اكتسابها من خلال التدريب غامضة. مستلهمين من المناهج العصبية المعرفية، نعتبر إعدادًا منخفضًا للغاية لفحص ما إذا كانت نماذج الانتشار تتعلم تمثيلات ذات معنى دلالي ومكونة من ميزات قابلة للتكوين. قمنا بإجراء تجارب مضبوطة شاملة على نماذج الانتشار الاحتمالية الموجهة بالشرط (DDPMs) المدربة على إنتاج أشكال مختلفة من بيانات Gaussian ثنائية الأبعاد. وجدنا أن النماذج تتعلم تمثيلات مكونة ولكن ليست مستمرة تمامًا لتشفير الميزات المستمرة للاختلافات الأساسية للبيانات. مع مثل هذه التمثيلات، تُظهر النماذج قدرة تركيبية متفوقة ولكن قدرة محدودة على الاستيفاء على القيم غير المرئية لميزة معينة. تُظهر نتائجنا التجريبية أيضًا أن نماذج الانتشار يمكنها تحقيق التأليفي مع عدد قليل من الأمثلة التركيبية، مما يقترح طريقة أكثر كفاءة لتدريب DDPMs. أخيرًا، نربط تشكيل المانيفولد في نماذج الانتشار بنظرية الترشيح في الفيزياء، مما يقدم رؤية حول ظهور مفاجئ للتعلم بالتمثيل المكون. تساهم تجاربنا المجهزة بعناية في فهم أعمق لكيفية التقاط نماذج الانتشار للهيكل التركيبي في البيانات.
درس ليانغ وآخرون (الجمعة) هذا السؤال.