الملخص: نقدم، في إعداد نموذج موحد، تدهوراً متسقاً يعتمد على الجرعة في التفسير العاطفي لنماذج اللغة الكبيرة (LLMs) تحت الضغط الدلالي، الذي نسميه الانحسار العاطفي الخوارزمي (AAB؛ فقدان معتمد على الجرعة لوضوح التفسير العاطفي تحت الضغط الدلالي). نحن نحقق في هذه الظاهرة من خلال بروتوكول موحد (N=200 جولة، 600 تقييم على مستوى المقيمين) باستخدام نموذج ذو وزن مفتوح واحد () تحت إعدادات فك الترميز الثابتة. في هذه المراجعة، نحن (i) نقدم تحللاً محاكيًا مطابقًا في الطول لهيكل ضغط المرحلة 3 إلى ظروف فرعية فقط من الضوضاء وظروف فقط من الشخصية، (ii) نكمل النتائج التجريبية للمرحلة 3 بمسبار محاكي استكشافي (المرحلة 4) لاختبار فرضية المحاذاة والهشاشة تحت هياكل أساسية/توجيه مطابقة، و(iii) نقدم بروكسي حسابي لمؤشر التدهور العاطفي (ADI) لتعزيز الموضوعية والقدرة على التوسع. نوضح أن "المجمع العاطفي" هو استعارة وظيفية بدلاً من ادعاء ميكانيكي، وأن نتائج المرحلة 4 هي اختبارات ضغط استكشافية بدلاً من أدلة تجريبية جديدة. توفر الدراسة معيارًا تجريبيًا للتدهور التفسيري والصلابة العاطفية في LLMs، مع صلة مباشرة بتطبيقات الذكاء الاصطناعي الغنية بالعواطف مثل الأنظمة الحوارية والاستشارية.
درس رايان سانغ باك كيم (الخميس) هذا السؤال.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: