يهدف التعلم بدون تدريب (ZSL) إلى التعرف على الفئات غير المرئية من خلال نقل المعرفة الدلالية من الفئات المرئية. ومع ذلك، غالباً ما تواجه الطرق الحالية صعوبة مع الفجوة الدلالية المستمرة الناتجة عن محددات دلالية محدودة ونمذجة خصائص بصرية صارمة. على وجه الخصوص، تؤدي نمذجة أوصاف الصفات على مستوى الفئة المحددة مسبقاً كحقيقة ثابتة إلى عرقلة التوافق بين الدلالي والبصري بشكل فعال إلى حد ما. لتخفيف هذه المشكلات، نقترح شبكة تحسين النماذج المزدوجة الموجهة ثنائياً (BPRN)، وهي إطار عمل جديد للتعلم بدون تدريب مصمم لتحسين النماذج المزدوجة عبر المجالات الفرعية ذات المقاييس المتنوعة. بشكل محدد، نقوم أولاً بفك الارتباط بين العلاقات بين الدلالات على مستوى الفئة ونستخدمها لتوليد نماذج بصرية زائفة مكافئة. ثم، من خلال الاستفادة من معلومات التوزيع عبر النماذج المزدوجة في مجالات فرعية مختلفة، تحقق BPRN التوافق الثنائي الاتجاه بين الأنماط البصرية والدلالية. أخيرًا، يتم اعتماد تمثيل مستخلص على مستوى الفئة مستمد من النماذج المزدوجة المحسّنة للاستدلال، بدلاً من الاعتماد على نموذج واحد. تظهر التجارب الواسعة التي أجريت على خمسة مجموعات بيانات معيارية للتعلم بدون تدريب أن BPRN تحقق بشكل متسق أداءً تنافسياً أو حتى أفضل. بشكل محدد، في سيناريو GZSL، تظهر BPRN تحسنًا بنسبة 2.1٪، 7.3٪، 6.1٪، و4.8٪ على AWA1، AWA2، SUN، وaPY، على التوالي، مقارنةً بالأساليب الحالية القائمة على التضمين. كما تؤكد دراسات الإلغاء والتحليلات البصرية فعالية المكونات المقترحة.
درس رين وآخرون (الأربعاء) هذا السؤال.