Um Modelo de Visão-Linguagem com Fusão de Conhecimento Multi-Granular em Imagens Médicas | Synapse