March 19, 2024Open Access

نحو توليد وجه يمكن التحكم فيه باستخدام نماذج الانتشار الكامن الدلالي

Key Points

Key points are not available for this paper at this time.

Abstract

يعتبر تركيب الصور الدلالي (SIS) من بين التقنيات الأكثر شعبية وفعالية في مجال توليد وتحرير الوجوه، وذلك بفضل جودته العالية في التوليد والتنوع الذي يوفره. حاولت الأعمال الأخيرة تجاوز إطار العمل المعتمد على GAN، وبدأت في استكشاف نماذج الانتشار (DMs) لهذه المهمة حيث تبرز بالنظر إلى GANs من حيث الجودة والتنوع. من ناحية أخرى، تفتقر نماذج الانتشار إلى التحكم الدقيق والقدرة على إعادة الإنتاج. للتصدي لذلك، نقترح في هذه الورقة إطار عمل SIS يعتمد على بنية جديدة لنموذج الانتشار الكامن لتوليد وتحرير الوجه البشري والذي يمكنه إعادة إنتاج صورة مرجعية حقيقية والتلاعب بها، فضلاً عن توليد نتائج مدفوعة بالتنوع. يستخدم النظام المقترح كل من تطبيع SPADE وطبقات الانتباه المتبادل لدمج معلومات الشكل والأسلوب، ومن خلال القيام بذلك، يسمح بالتحكم الدقيق على كل جزء دلالي من الوجه البشري. لم يكن ذلك ممكنًا مع الأساليب السابقة في الحالة الفنية. أخيرًا، قمنا بإجراء مجموعة واسعة من التجارب لإثبات أن نموذجنا يتفوق على الحالة الفنية الحالية، سواء من الناحية النوعية أو الكمية.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Alex Ergasti

University of Parma

Claudio Ferrari

University of Siena

Tomaso Fontanini

University of Parma

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

نحو توليد وجه يمكن التحكم فيه باستخدام نماذج الانتشار الكامن الدلالي

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider

Also consider