Key points are not available for this paper at this time.
الطرق الحالية للتقسيم الدلالي المُشرف عليه بشكل ضعيف التي تستخدم التعليقات التوضيحية على مستوى الصورة تعتمد عادةً على الاستجابات الأولية لتحديد مناطق الأجسام. ومع ذلك، فإن مثل هذه الخرائط الاستجابية التي يتم إنشاؤها بواسطة شبكة التصنيف تركز عادةً على الأجزاء التمييزية للأجسام، نظرًا لأن الشبكة لا تحتاج إلى الجسم بالكامل لتحسين دالة الهدف. لفرض الانتباه على أجزاء أخرى من الجسم، نقترح نهجًا بسيطًا ولكنه فعال يقدم مهمة تُشرف على نفسها من خلال استغلال معلومات الفئات الفرعية. على وجه التحديد، نقوم بتجميع ميزات الصور لإنشاء تسميات ذات فئات فرعية زائفة ضمن كل فئة أم موضحة، ونبني هدفًا للفئة الفرعية لتعيين الشبكة لمهمة أكثر تحديًا. من خلال تجميع ميزات الصورة بشكل متكرر، لا يقتصر عملية التدريب على الأجزاء الأكثر تمييزًا للأجسام، مما يحسن جودة الخرائط الاستجابية. نقوم بإجراء تحليل واسع للتحقق من الطريقة المقترحة ونظهر أن نهجنا يقدم أداءً جيدًا مقارنةً بالطرق المتطورة.
Chang et al. (Mon,) studied this question.
Synapse has enriched one closely related paper. Consider it for comparative context: