What type of study is this?

This is a Experimental Study study.

October 13, 2025Open Access

نفس السؤال، كلمات مختلفة: إطار تنافسي كامن ل مرونة التحفيز

Key Points

تحسين بـ 0.5%-4% في معدل الفوز في أسوأ الحالات يشير إلى مكاسب ملحوظة في الأداء.
التفسير التنافسي الكامن يُحسن نماذج اللغة باستخدام الاضطرابات القابلة للتعلم وتنظيم لاغرانج.
تجارب موسعة تُثبت فعالية LAP عبر هياكل متعددة لنماذج اللغة.
الإطار يعالج اختلافات التحفيز، مما يقلل من الاعتماد على استراتيجيات التجربة والخطأ لنشر أفضل.

Abstract

عدم الحساسية للاختلافات التي تحافظ على الدلالة في التحفيزات (التعابير المعاد صياغتها) أمر بالغ الأهمية لسلوك موثوق ونشر العالم الحقيقي لنماذج اللغة الكبيرة. ومع ذلك، تظهر نماذج اللغة تدهورًا كبيرًا في الأداء عند مواجهتها مع تحفيزات دلالتها مكافئة ولكن بصياغات مختلفة، والحلول الحالية تعتمد إما على هندسة التحفيز بالتجربة والخطأ أو تتطلب خوارزميات مكلفة حسابيًا في وقت الاستنتاج. في هذه الدراسة، المستندة إلى الفهم الرئيسي بأن أسوأ حالات التحفيز تشهد انحرافًا في فضاء التضمين، نقدم التفسير التنافسي الكامن (LAP)، وهو إطار تنافسي مزدوج: الحلقة الداخلية تُدرّب اضطراباً قابلاً للتعلم ليكون "إعادة صياغة مستمرة كامنة" مع الحفاظ على الدلالة من خلال تنظيم لاغرانج، بينما تقوم الحلقة الخارجية بتحسين معلمات نموذج اللغة بناءً على هذه الاضطرابات. نجري تجارب موسعة لإظهار فعالية LAP عبر عدة هياكل لنماذج اللغة على معيار RobustAlpaca مع تحسين مطلق يتراوح بين 0.5%-4% في أسوأ معدلات الفوز مقارنة بالتدريب المراقب التقليدي.

Read Full Paperexternally

اسأل الذكاء الاصطناعي

Bookmark

View Full Paper