Key points are not available for this paper at this time.
تطورت الميمات كوسيلة شائعة للتواصل المتنوع، بدءًا من الفكاهة إلى الدعاية. مع زيادة شعبية المحتوى الموجه نحو الصور، هناك حاجة متزايدة لاستكشاف أضرارها المحتملة من جوانب مختلفة. لقد قامت الدراسات السابقة بتحليل الميمات في إعدادات مغلقة - اكتشاف الأذى، تطبيق التسميات الدلالية، وتقديم تفسيرات بلغة طبيعية. لتوسيع هذا البحث، نقدم MemeMQA، إطار عمل للإجابة على الأسئلة متعددة الوسائط يهدف إلى الحصول على إجابات دقيقة على أسئلة منظمة مع تقديم تفسيرات متسقة. نقوم بإعداد MemeMQACorpus، مجموعة بيانات جديدة تحتوي على 1,880 سؤالاً مرتبطًا بـ 1,122 ميمًا مع أزواج إجابة-تفسير مقابلة. نقترح أيضًا ARSENAL، إطار عمل جديد من مرحلتين متعدد الوسائط يستفيد من قدرات الاستدلال لـ LLMs لمعالجة MemeMQA. نقوم بتقييم MemeMQA باستخدام معايير تنافسية ونظهر تفوقه - تحسين دقة توقع الإجابات بنحو 18% وإنتاج نصوص متميزة عبر مقاييس مختلفة تقيس التوافق المعجمي والدلالي مقارنةً بأفضل معيار أساسي. نقوم بتحليل قوة ARSENAL من خلال تنويع مجموعة الأسئلة، وتقييم قائم على الخلط فيما يتعلق بعامليّتنا لموضع MemeMQA، والتقييم الخاص بالنمط، مما يعزز فهمنا لتفسير الميمات في مشهد التواصل متعدد الوسائط.
أجرى أغاروال وزملاؤه (سبت) دراسة حول هذا السؤال.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: