Integración de Pre-entrenamiento de Texto e Imagen para Razonamiento Algorítmico Multi-modal | Synapse