Key points are not available for this paper at this time.
تت adopt معظم الطرق الحديثة لتقسيم الدلالات شبكة كاملة التلافيف (FCN) مع بنية مشفر-فك تشفير. يقوم المشفر تدريجياً بتقليل الدقة المكانية ويتعلم مفاهيم بصرية أكثر تجريدًا/دلالية مع مجالات استقبالية أكبر. نظرًا لأن نمذجة السياق ضرورية للتقسيم، فإن الجهود الأخيرة قد تركزت على زيادة المجال الاستقبالي، إما من خلال التلافيف المتوسعة/العريضة أو بإدخال وحدات انتباه. ومع ذلك، تظل بنية FCN المعتمدة على المشفر-فك التشفير دون تغيير. في هذه الورقة، نهدف إلى تقديم منظور بديل من خلال اعتبار تقسيم الدلالات كوظيفة تنبؤ تسلسلي. بشكل محدد، نستخدم محولًا بحتًا (أي، بدون تلافيف وتقليل الدقة) لتمثيل الصورة كسلسلة من الأقسام. مع نمذجة السياق العالمي في كل طبقة من المحول، يمكن دمج هذا المشفر مع فك تشفير بسيط لتوفير نموذج تقسيم قوي، يسمى SEgmentation TRansformer (SETR). تظهر التجارب الواسعة أن SETR تحقق مستوى جديد من الأداء الفني على ADE20K (50.28% mIoU)، وسياق Pascal (55.83% mIoU) ونتائج تنافسية على Cityscapes. بشكل خاص، نحقق المركز الأول في قائمةLeaderboard الخاصة بخادم اختبار ADE20K التنافسي للغاية في يوم التقديم.
Building similarity graph...
Analyzing shared references across papers
Loading...
Sixiao Zheng
Fudan University
Jiachen Lu
Shanghai University
Hengshuang Zhao
University of Hong Kong
University of Oxford
Fudan University
University of Surrey
Building similarity graph...
Analyzing shared references across papers
Loading...
درس Zheng et al. (الثلاثاء) هذا السؤال.
synapsesocial.com/papers/69d80a0405ee2ba81dbeec84 — DOI: https://doi.org/10.1109/cvpr46437.2021.00681
Synapse has enriched 4 closely related papers on similar clinical questions. Consider them for comparative context: