VEGA: Aprendizado de Compreensão Intercalada de Imagens e Texto em Modelos de Linguagem Visual de Grande Escala | Synapse