Key points are not available for this paper at this time.
تظهر الأساليب الحديثة لاكتشاف الكائنات ثلاثية الأبعاد المعتمدة على ليدار نتائج واعدة، لكنها غالبًا لا تعمّم بشكل جيد على المجالات المستهدفة خارج توزيع بيانات المصدر (أو التدريب). لتقليل هذه الفجوات بين المجالات وبالتالي جعل نماذج اكتشاف الكائنات ثلاثية الأبعاد أكثر تعميمًا، نقدم طريقة جديدة للتكيف مع المجال غير المراقب، تُسمى CMDA، والتي (i) تستفيد من الإشارات الدلالية المرئية من نمط الصورة (أي، صور الكاميرا) كجسر دلالي فعال لسد الفجوة بين المجالات في تمثيلات العرض الجوي (BEV) المتعددة الأنماط. علاوة على ذلك، (ii) نقدم أيضًا استراتيجية تعلم قائمة على التدريب الذاتي، حيث يتم تدريب النموذج بطريقة تعاكسية لتوليد ميزات غير متغيرة عبر المجالات، مما يعطل تمييز ما إذا كانت حالة الميزة تأتي من مصدر أو من مجال مستهدف غير مرئي. بشكل عام، يوجه إطار عمل CMDA نموذج اكتشاف الكائنات ثلاثية الأبعاد لتوليد ميزات غنية بالمعلومات وقابلة للتكيف مع المجالات لتوزيعات البيانات الجديدة. في تجاربنا الواسعة مع المعايير ذات النطاق الكبير، مثل nuScenes وWaymo وKITTI، توفر النتائج المذكورة أعلاه تحسينات كبيرة في الأداء لمهام التكيف مع المجال غير المراقب، محققة أداءً متقدماً في هذا المجال.
بحث تشانغ وآخرون (Sun) في هذا السؤال.