يواجه نشر نماذج اللغة الكبيرة (LLMs) في المؤسسات تحديات مستمرة أثناء وقت الاستدلال: الهلوسات المعبرة عنها بثقة عالية، وعدم الاتساق الداخلي عبر التفاعلات، والانعكاسات غير المبررة للمواقف تحت ضغط المستخدم، والتكيف الزائد مع التفضيلات المتصورة. بينما حقق العمل الحديث في تقييم LLM وأخذ العينات الذاتية الاتساق تقدمًا في بعض هذه القضايا، لا يزال آلية استقرار مخصصة أثناء وقت الاستدلال—مختلفة عن المحاذاة أثناء التدريب والحواجز الخارجية—غير مستكشفة بشكل كاف. تقدم هذه الورقة تنظيم الاتساق التقييمي (ECR)، وهي طبقة استقرار أثناء وقت الاستدلال تقيد عدم الاتساق الداخلي عبر آفاق التفكير القصيرة باستخدام معايير صريحة وقابلة للقياس. لا يقوم ECR بتعديل معلمات النموذج، ولا يتطلب إعادة تدريب، ولا يفترض الوصول إلى الحقيقة الأرضية. بدلاً من ذلك، يقيّم مسارات الاستجابات المرشحة المتعددة باستخدام مقاييس اتساق معرفية رياضيًا — مثل التباين التقييمي، معدل التناقض، سلاسة المسار، استقرار التوقع، وتباعد السياسة—كلها تم تطبيعها إلى المجال 0,1، ويختار الاستجابات التي تظل مستقرة داخليًا تحت حالة عدم اليقين. يتموضع ECR صراحةً كآلية احتواء وموثوقية للأنظمة الذكية الناضجة، وليس كهدف تحسين، أو ضمان محاذاة، أو نظام تحقق من الحقيقة. نقدم تعريفات رسمية مع مخططات تطبيع صريحة، خوارزمية اختيار أثناء الاستدلال، شروط نضج النظام، حدود النطاق، مثال رقمي مُطبق، وإرشادات عملية للنشر. الإطار خفيف الوزن، يمكن تدقيقه، محايد للبائع، ومصمم لتلبية الاحتياجات العملية والمفاهيمية لنشر الذكاء الاصطناعي في المؤسسات.
درس أريجيت تشاترجي (الجمعة) هذا السؤال.