VidLA: Alinhamento Vídeo-Linguagem em Grande Escala | Synapse