Strukturinduzierte Gradientregulierung für verallgemeinerbare Vision-Sprachmodelle | Synapse