What type of study is this?

This is a Literature Review study.

September 27, 2025Open Access

Rumo à Síntese de Imagens Sustentável: Uma Revisão Abrangente dos Modelos de Geração de Texto para Imagem

Key Points

Os modelos de geração de imagem a partir de texto agora produzem imagens de alta fidelidade que são contextualmente precisas a partir de entradas em linguagem natural, refletindo avanços significativos.
Frameworks líderes como DALL-E 2 e Stable Diffusion melhoram a qualidade e diversidade das imagens, mas enfrentam desafios na consistência semântica e nas demandas computacionais.
A avaliação abrangente dos modelos geradores, incluindo GANs e VAEs, revela técnicas eficazes para alcançar síntese de imagem realista com vários trade-offs.
Esta análise destaca a necessidade de futuras pesquisas focadas em práticas éticas e ambientalmente responsáveis na geração de imagens.

Abstract

A geração de imagem a partir de texto representa uma fronteira em rápida evolução na inteligência artificial, permitindo a transformação de descrições em linguagem natural em imagens visualmente coerentes e semanticamente ricas. Este artigo apresenta uma revisão abrangente dos modelos geradores de última geração — incluindo Redes Adversariais Generativas (GANs), Autoencoders Variacionais (VAEs) e Modelos de Difusão avançados — com foco em suas capacidades de produzir imagens de alta fidelidade e precisão contextual a partir de entradas textuais. Além disso, analisamos os principais frameworks de síntese de imagem sustentável, como DALL-E 2, Stable Diffusion, Imagen e MidJourney, avaliando seus avanços na qualidade da imagem, alinhamento semântico, diversidade e eficiência computacional. Nossa avaliação sistemática destaca o progresso significativo na geração de imagens realistas de alta resolução, ao mesmo tempo que identifica desafios persistentes relacionados à consistência semântica, controle refinado, considerações éticas e demandas computacionais substanciais. Além disso, discutimos trade-offs críticos entre desempenho do modelo e sustentabilidade, promovendo direções de pesquisa futuras visando o desenvolvimento de sistemas de geração de texto para imagem mais eficientes, justos e ambientalmente responsáveis. Esta pesquisa serve como um recurso orientador para a próxima geração de tecnologias de síntese de texto para imagem sustentáveis impulsionadas por IA.

Rumo à Síntese de Imagens Sustentável: Uma Revisão Abrangente dos Modelos de Geração de Texto para Imagem

Key Points

Abstract

Cite This Study

Also Consider

Also Consider