Key points are not available for this paper at this time.
في هذه الورقة، نقترح الشبكة التوليدية التنافسية ذات الانتباه الذاتي (SAGAN) التي تتيح نمذجة اعتماديات طويلة المدى معتمدة على الانتباه لمهام توليد الصور. تولد الشبكات التوليدية التنافسية التقليدية تفاصيل عالية الدقة كوظيفة لنقاط محلية فقط في خرائط الميزات ذات الدقة الأقل. في SAGAN، يمكن توليد التفاصيل باستخدام إشارات من جميع مواقع الميزات. علاوة على ذلك، يمكن للمميز التحقق من أن الميزات عالية التفاصيل في أجزاء بعيدة من الصورة متناسقة مع بعضها. بالإضافة إلى ذلك، أظهرت الأبحاث الحديثة أن تكييف المولد يؤثر على أداء الشبكات التوليدية التنافسية. من خلال الاستفادة من هذه الرؤية، نطبق التطبيع الطيفي على مولد الشبكة التوليدية التنافسية ونجد أن ذلك يحسن ديناميات التدريب. تحقق SAGAN المقترحة نتائج رائدة، حيث زادت أفضل نتيجة منشورة في مقياس Inception من 36.8 إلى 52.52 وقللت من مسافة Frechet Inception من 27.62 إلى 18.65 على مجموعة بيانات ImageNet التحديّة. توضح تصور طبقات الانتباه أن المولد يستفيد من الأحياء التي تتوافق مع أشكال الأجسام بدلاً من المناطق المحلية ذات الشكل الثابت.
درس Zhang et al. (Mon,) هذا السؤال.