What question did this study set out to answer?

تهدف الدراسة إلى تعزيز كفاءة وكلاء استخدام الكمبيوتر من خلال دمج نظام ذاكرة دائمة قائم على الرسم البياني الموجه.

June 4, 2026Open Access

ذاكرة دائمة منظمة على شكل رسم بياني لاستخدام فعّال لوكلاء الكمبيوتر المعتمدين على نماذج اللغة الكبيرة

Key Points

تهدف الدراسة إلى تعزيز كفاءة وكلاء استخدام الكمبيوتر من خلال دمج نظام ذاكرة دائمة قائم على الرسم البياني الموجه.
تم تطوير وكيل معزز بالذاكرة تم تشكيله على أنه S=⟨A,Σ,G,δ,π,Φ⟩.
تم تعريف شروط إمكانية الوصول إلى المهام وتغطية الذاكرة باستخدام نظرية الاستقرار الوظيفي.
تمت إجراء تجارب على OSWorld لمقارنة الوكيل المقترح ضد قاعدة بلا ذاكرة.
قلل الوكيل المعزز بالذاكرة من استهلاك رموز LLM بنحو 50٪ مقارنة بقاعدة البيانات.
كما تم تقليل زمن التنفيذ بنسبة حوالي 50٪ مع الحفاظ على معدلات نجاح قابلة للمقارنة (≈36.9٪ في المهام ذات الـ15 خطوة و≈46.9٪ في المهام ذات الـ50 خطوة).
تؤكد المساهمة على الكفاءة التشغيلية من خلال استخدام ذاكرة الرسم البياني القابلة لإعادة الاستخدام.

Abstract

تعمل وكلاء استخدام الكمبيوتر المعتمدون على نموذج اللغة الكبير (LLM) على أتمتة مهام واجهة المستخدم الرسومية (GUI) ولكنهم غالبًا ما يعيدون حل المهام الفرعية التي واجهوها سابقًا، مما يزيد من استخدام الرموز والزمن المستغرق. نتناول هذه القاعدة من خلال ذاكرة دائمة قائمة على الرسم البياني الموجه حيث تمثل العقد الحالات المرئية لـ GUI وتشفّر الحواف تسلسلات الإجراءات القابلة للتنفيذ. نقوم بتشكيل الوكيل المعزز بالذاكرة على أنه S=⟨A,Σ,G,δ,π,Φ⟩، ونعرف شروط إمكانية الوصول إلى المهام وتغطية الذاكرة مستوحاة من نظرية الاستقرار الوظيفي، ونستخلص حدود كفاءة تكلفة الرموز. من حيث نظرية التحكم، يمكن تفسير بنية المدير-العمالة كنظام حلقة مغلقة حيث تقدم الذاكرة تغذية راجعة تعتمد على الخبرة؛ يتم استخدام هذا التفسير كتشبيه وليس كبينة كاملة لنموذج التحكم التكيفي المرجعي. تُظهر التجارب على OSWorld أن الوكيل المقترح يقلل من استهلاك الرموز من LLM وزمن التنفيذ بنسبة حوالي 50٪ مقارنة بقاعدة بلا ذاكرة مع الحفاظ على معدلات نجاح قابلة للمقارنة (≈36.9٪ في المهام ذات الـ15 خطوة و≈46.9٪ في المهام ذات الـ50 خطوة). وبالتالي، تركز المساهمة المثبتة على الكفاءة التشغيلية من خلال ذاكرة الرسم البياني القابلة لإعادة الاستخدام، وليس ادعاء بتحسين نجاح المهام أو استقرار لابنوف الكلاسيكي.

ذاكرة دائمة منظمة على شكل رسم بياني لاستخدام فعّال لوكلاء الكمبيوتر المعتمدين على نماذج اللغة الكبيرة

Key Points

Abstract

Cite This Study