Warum antworten LLaVA Vision-Language-Modelle auf Bilder in Englisch? | Synapse