Key points are not available for this paper at this time.
يعتبر استرجاع الكلمات الرئيسية ذات العطاء ذات الصلة بدقة لاستفسارات المستخدمين أمرًا حاسمًا في البحث المدعوم ولكنه لا يزال يمثل تحديًا، خاصة بالنسبة للاستفسارات القصيرة وغير الواضحة. غالبًا ما تفشل نماذج الاسترجاع الكثيفة والتوليدية الحالية في التقاط نية المستخدم الدقيقة في هذه الحالات. لمعالجة ذلك، نقترح نهجًا لتعزيز فهم الاستعلامات من خلال تعزيز الاستعلامات بإشارات سياقية غنية مستمدة من نتائج البحث على الويب ونماذج اللغة الكبيرة، المخزنة في ذاكرة مؤقتة على الإنترنت. على وجه التحديد، نستخدم عناوين ولقطات البحث على الويب لتثبيت الاستعلامات في معلومات العالم الحقيقي ونستخدم GPT-4 لإنشاء إعادة صياغة للاستعلامات وتفسيرات توضح نية المستخدم. يتم دمج هذه الإشارات بكفاءة من خلال بنية Unity المستندة إلى Fusion-in-Decoder، مما يمكّن كل من الاسترجاع الكثيف والتوليدي مع تكاليف خدمة تعادل النماذج التقليدية الخالية من السياق. لمعالجة السيناريوهات حيث لا يتوفر السياق في الذاكرة المؤقتة، نقدم واحدة من استراتيجيات التعلم المنهجي المعروفة باسم نظرة على السياق، والتي تحسن من متانة النموذج وأدائه حتى بدون إشارات سياقية أثناء الاستدلال. تظهر التجارب الكبيرة غير المتصلة بالإنترنت أن نهجنا المدرك للسياق يتفوق بشكل كبير على النماذج الخالية من السياق. علاوة على ذلك، تظهر اختبارات A/B الحية على محرك بحث بارز عبر أكثر من 160 دولة تحسينات كبيرة في تفاعل المستخدم والإيرادات.
درس موهانكومار وآخرون (الجمعة) هذا السؤال.