A restauração de imagens de faces é uma tarefa crítica em visão computacional devido às complexas características semânticas e texturais das estruturas faciais. Embora os métodos existentes baseados em aprendizado profundo tenham alcançado algum progresso, eles frequentemente produzem resultados borrados ou suscetíveis a artefatos ao lidar com grandes oclusões, como máscaras faciais. Para enfrentar esses desafios, este artigo propõe uma nova estrutura de rede generativa adversarial (GAN) adaptada para a restauração de faces mascaradas. O gerador adota uma arquitetura U-Net aprimorada com um módulo residual de atenção mista em múltiplas escalas (MMRM), que integra convoluções de múltiplos ramos para campos receptivos diversos e combina mecanismos de atenção espacial e de canal para priorizar características semânticamente relevantes. O decodificador melhora ainda mais a fusão de características através de um mecanismo de atenção de canal, que enfatiza seletivamente padrões significativos durante a reconstrução do mapa de características. Um conjunto de dados realista de faces mascaradas foi sintetizado usando o banco de dados CelebA, ajustando dinamicamente posições, tamanhos e ângulos das máscaras com base em marcos faciais, garantindo alinhamento com cenários do mundo real. Avaliações quantitativas e qualitativas demonstram que nosso método supera modelos convencionais tanto em qualidade visual quanto em métricas quantitativas. Estudos de ablação validam ainda mais a eficácia do MMRM e dos mecanismos de atenção na preservação da coerência estrutural e na redução de artefatos.
Liu et al. (quarta-feira) estudaram essa questão.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: