What type of study is this?

This is a Quantitative Study study (also classified as: Experimental Study).

October 2, 2025Open Access

نماذج اللغات المعاد ترتيبها تخدعها أوجه التشابه المعجمية

Key Points

تشير النتائج إلى أن نماذج LM المعاد ترتيبها عانت لتتجاوز خط الأساس البسيط BM25 على مجموعة بيانات DRUID، مما يكشف عن مشكلات في الأداء.
كشف التقييم أن أداء نماذج LM المعاد ترتيبها تحسن بشكل رئيسي على مجموعة بيانات NQ، مما يشير إلى نقاط قوة خاصة بالمجموعة.
تحدد الدراسة نقاط ضعف في نماذج LM المعاد ترتيبها من خلال تحليل الأخطاء المتعلقة بالاختلافات المعجمية أثناء الاسترجاع.
تشدد النتائج على ضرورة وجود مجموعات بيانات أكثر معاكسة لتقييم قدرات نماذج اللغات المعاد ترتيبها بشكل أكثر قوة.

Abstract

تُستخدم نماذج اللغات (LM) المعاد ترتيبها لتحسين نتائج الاسترجاع في التوليد المدعوم بالاسترجاع (RAG). هي أكثر تكلفة من طرق المطابقة المعجمية مثل BM25 لكنها مفترَضة لمعالجة المعلومات الدلالية والعلاقات بين الاستعلام والإجابات المسترجعة بشكل أفضل. لفهم ما إذا كانت نماذج LM المعاد ترتيبها تحقق دائمًا هذا الافتراض، قمنا بتقييم 6 نماذج مختلفة على مجموعات بيانات NQ وLitQA2 وDRUID. تظهر نتائجنا أن نماذج LM المعاد ترتيبها تجد صعوبة في التفوق على خط الأساس البسيط BM25 في مجموعة DRUID. باستخدام معيار فصل جديد يستند إلى نتائج BM25، نشرح ونحدد أخطاء المعاد ترتيبها الناجمة عن اختلافات معجمية. كما نحقق في طرق مختلفة لتحسين أداء نماذج LM المعاد ترتيبها ووجدنا أن هذه الطرق مفيدة أساسًا لمجموعة NQ. مجتمعة، تحدد دراستنا وتشرح نقاط الضعف في نماذج LM المعاد ترتيبها وتشير إلى الحاجة إلى مجموعات بيانات أكثر معاكسة وواقعية لتقييمها.

نماذج اللغات المعاد ترتيبها تخدعها أوجه التشابه المعجمية

Key Points

Abstract

Cite This Study