September 28, 2025Open Access

GraphCogent: التغلب على قيود الذاكرة العاملة في النماذج اللغوية الكبيرة من خلال التعاون متعدد الوكلاء في فهم الرسوم البيانية المعقدة

Key Points

يحقق GraphCogent تحسنًا بنسبة 50% في الدقة مقارنةً بالنماذج اللغوية الأكبر حجمًا، معززًا قدرات الاستدلال على الرسوم البيانية في المهام المعقدة.
يعمل الإطار من خلال نظام ثلاثي الوحدات يركز على عمليات الإدراك، التخزين المؤقت، والتنفيذ لتحقيق الكفاءة.
يغطي التقييم باستخدام معيار Graph4real 21 مهمة استدلال على الرسوم البيانية متميزة عبر مجالات العالم الحقيقي المختلفة.
يقلل هذا الإطار القائم على الوكلاء بشكل كبير من استخدام الرموز، مما يبرز الإمكانية لتحسين الكفاءة الحسابية في النماذج اللغوية الكبيرة.

Abstract

تُظهر النماذج اللغوية الكبيرة (LLMs) أداءً واعدًا في مهام الاستدلال على الرسوم البيانية صغيرة النطاق لكنها تفشل عند التعامل مع الرسوم البيانية الواقعية ذات الاستفسارات المعقدة. ينجم هذا الظاهرة عن عدم قدرة LLMs على معالجة طوبولوجيا الرسوم البيانية المعقدة وأداء التفكير متعدد الخطوات في آن واحد بفعالية. لمعالجة هذه القيود، نقترح GraphCogent، إطار عمل لوكلاء متعاونين مستوحى من نموذج الذاكرة العاملة البشري الذي يقسم الاستدلال على الرسوم البيانية إلى عمليات إدراكية متخصصة: الإدراك، التخزين المؤقت، والتنفيذ. يتألف الإطار من ثلاث وحدات: وحدة الإحساس التي توحد تمثيلات نصوص الرسوم البيانية المتنوعة عبر أخذ عينات من الرسوم الجزئية، وحدة التخزين المؤقت التي تدمج وتفهرس بيانات الرسوم البيانية عبر صيغ متعددة، ووحدة التنفيذ التي تجمع بين استدعاء الأدوات وتوليد النماذج لتحقيق استدلال فعال. كما نقدم Graph4real، معيار شامل يحتوي على أربعة مجالات لرسوم بيانية من العالم الحقيقي (الويب، الاجتماعية، النقل، والاقتباس) لتقييم قدرات LLMs في الاستدلال على الرسوم البيانية. يغطي Graph4real لدينا 21 مهمة استدلال على الرسوم البيانية مختلفة، مصنفة ضمن ثلاثة أنواع (الاستعلام الهيكلي، الاستدلال الخوارزمي، ومهام النمذجة التنبؤية) مع مقاييس رسوم بيانية أكبر بعشرة أضعاف من المعايير الحالية. تظهر التجارب أن GraphCogent المبني على Llama3.1-8B يحقق تحسنًا بنسبة 50% مقارنة بالنماذج اللغوية الضخمة مثل DeepSeek-R1 (671B). مقارنةً بأحدث النماذج القائمة على الوكلاء، يتفوق إطار عملنا بنسبة 20% في الدقة مع تقليل استخدام الرموز بنسبة 80% لمهام ضمن مجموعة الأدوات و30% لمهام خارج المجموعة. سيكون الرمز متاحًا بعد المراجعة.

Read Full Paperexternally

اسأل الذكاء الاصطناعي

Bookmark

View Full Paper