Richtung automatische Bewertung der klinischen Fähigkeiten von LLMs: Metrik, Daten und Algorithmus | Synapse