Qwen-VL: Um Modelo Versátil de Visão-Linguagem para Compreensão, Localização, Leitura de Texto e Além | Synapse