Key points are not available for this paper at this time.
يعتبر تركيب الصور الدلالي (SIS) من بين التقنيات الأكثر شعبية وفعالية في مجال توليد وتحرير الوجوه، وذلك بفضل جودته العالية في التوليد والتنوع الذي يوفره. حاولت الأعمال الأخيرة تجاوز إطار العمل المعتمد على GAN، وبدأت في استكشاف نماذج الانتشار (DMs) لهذه المهمة حيث تبرز بالنظر إلى GANs من حيث الجودة والتنوع. من ناحية أخرى، تفتقر نماذج الانتشار إلى التحكم الدقيق والقدرة على إعادة الإنتاج. للتصدي لذلك، نقترح في هذه الورقة إطار عمل SIS يعتمد على بنية جديدة لنموذج الانتشار الكامن لتوليد وتحرير الوجه البشري والذي يمكنه إعادة إنتاج صورة مرجعية حقيقية والتلاعب بها، فضلاً عن توليد نتائج مدفوعة بالتنوع. يستخدم النظام المقترح كل من تطبيع SPADE وطبقات الانتباه المتبادل لدمج معلومات الشكل والأسلوب، ومن خلال القيام بذلك، يسمح بالتحكم الدقيق على كل جزء دلالي من الوجه البشري. لم يكن ذلك ممكنًا مع الأساليب السابقة في الحالة الفنية. أخيرًا، قمنا بإجراء مجموعة واسعة من التجارب لإثبات أن نموذجنا يتفوق على الحالة الفنية الحالية، سواء من الناحية النوعية أو الكمية.
Building similarity graph...
Analyzing shared references across papers
Loading...
Alex Ergasti
University of Parma
Claudio Ferrari
University of Siena
Tomaso Fontanini
University of Parma
Building similarity graph...
Analyzing shared references across papers
Loading...
درس إيرغاستي وزملاؤه (ثلاثاء) هذا السؤال.
synapsesocial.com/papers/68e7362fb6db6435876b02e5 — DOI: https://doi.org/10.48550/arxiv.2403.12743
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: