May 18, 2024Open Access

MemeMQA: الإجابة على الأسئلة متعددة الوسائط للميمات عبر الاستدلال القائم على العقل

Key Points

Key points are not available for this paper at this time.

Abstract

تطورت الميمات كوسيلة شائعة للتواصل المتنوع، بدءًا من الفكاهة إلى الدعاية. مع زيادة شعبية المحتوى الموجه نحو الصور، هناك حاجة متزايدة لاستكشاف أضرارها المحتملة من جوانب مختلفة. لقد قامت الدراسات السابقة بتحليل الميمات في إعدادات مغلقة - اكتشاف الأذى، تطبيق التسميات الدلالية، وتقديم تفسيرات بلغة طبيعية. لتوسيع هذا البحث، نقدم MemeMQA، إطار عمل للإجابة على الأسئلة متعددة الوسائط يهدف إلى الحصول على إجابات دقيقة على أسئلة منظمة مع تقديم تفسيرات متسقة. نقوم بإعداد MemeMQACorpus، مجموعة بيانات جديدة تحتوي على 1,880 سؤالاً مرتبطًا بـ 1,122 ميمًا مع أزواج إجابة-تفسير مقابلة. نقترح أيضًا ARSENAL، إطار عمل جديد من مرحلتين متعدد الوسائط يستفيد من قدرات الاستدلال لـ LLMs لمعالجة MemeMQA. نقوم بتقييم MemeMQA باستخدام معايير تنافسية ونظهر تفوقه - تحسين دقة توقع الإجابات بنحو 18% وإنتاج نصوص متميزة عبر مقاييس مختلفة تقيس التوافق المعجمي والدلالي مقارنةً بأفضل معيار أساسي. نقوم بتحليل قوة ARSENAL من خلال تنويع مجموعة الأسئلة، وتقييم قائم على الخلط فيما يتعلق بعامليّتنا لموضع MemeMQA، والتقييم الخاص بالنمط، مما يعزز فهمنا لتفسير الميمات في مشهد التواصل متعدد الوسائط.

MemeMQA: الإجابة على الأسئلة متعددة الوسائط للميمات عبر الاستدلال القائم على العقل

Key Points

Abstract

Cite This Study

Also Consider

Also Consider