Key points are not available for this paper at this time.
إن تقدير 6 درجات من الحرية لجميع الأجسام من صورة RGB واحدة لم تتم دراسته بشكل كافٍ. حتى طرق تقدير الوضعية من النهاية إلى النهاية لجسم واحد تكون أدنى مقارنة بالأساليب الحديثة من حيث الدقة. تعتمد معظم أطر تقدير الوضعية من 6 أبعاد على عدة مراحل وتعتمد على شبكات عميقة جاهزة للكشف عن الأجسام والنقاط الرئيسية لتأسيس علاقات بين نقاط الأجسام ثلاثية الأبعاد ومواقع الصورة ثنائية الأبعاد. بعد ذلك، يتم تطبيق نوع من RANSAC المستند إلى النقطة المنظورية (PnP) تليها عملية تحسين معقدة. في هذا العمل، نقترح إطارًا لتقدير الوضعية في 6 أبعاد للأجسام المتعددة عن طريق تحسين كاشف الأجسام الشهير YOLOX. الشبكة قابلة للتدريب من النهاية إلى النهاية وتكتشف كل جسم مع وضعيته من صورة RGB واحدة دون أي معالجة إضافية بعدية. نظهر أنه من خلال ضبط معلمات الوضعية في 6 أبعاد وتصميم دالة الخسارة بعناية، يمكننا تحقيق دقة عالية دون أي تحسين إضافي أو أي تمثيلات وسيطة. يحقق YOLO-6D-Pose نتائج متقدمة على مجموعات بيانات YCBV وLMO، متجاوزًا جميع الأساليب الأحادية القائمة. نقوم بتحليل منهجي لمختلف التعديلات في 6 أبعاد للتحقق من صحتها ونقترح تعديل ترجمة جديدة لهذه المهمة. الشبكة لا تعتمد على أي علاقات وهي مستقلة عن نموذج CAD أثناء الاستدلال. الشيفرة متاحة على https://github.com/TexasInstruments/edgeai-yolox.
درس ماجي وآخرون (Mon,) هذا السؤال.