نحو تقييم تلقائي لقدرات نموذج اللغة الكبيرة في السياقات السريرية: المقياس والبيانات والخوارزمية | Synapse