Key points are not available for this paper at this time.
تقدير الوضع من عرضين أمر أساسي لإعادة تحديد المواقع البصرية الخالية من الخرائط ومهام تتبع وضعية الأجسام. ومع ذلك، تعاني طرق المطابقة التقليدية من مُقدِّرات قوية تتطلب وقتًا طويلاً، في حين أن المُقدرون القائمون على التعلم العميق يركزون فقط على تقدير الوضع من الكاميرا إلى العالم، مما يفتقر إلى القابلية للتعميم على أحجام الصور المختلفة والخصائص الداخلية للكاميرا. في هذه الورقة، نقترح SRPose، وهو إطار قائم على نقاط رئيسية نادرة لتقدير الوضع النسبي من عرضين في سيناريوهات الكاميرا إلى العالم والأجسام إلى الكاميرا. يتكون SRPose من كاشف نقاط رئيسية نادرة، ومشفر موضع مع المعايرة الداخلية، وطبقات اهتمام موجهة بمعرفة سابقة قابلة للمطالبة. بالنظر إلى صورتين RGB لمشهد ثابت أو جسم متحرك، يقدر SRPose تحول وضع الكاميرا النسبي أو وضع الجسم ثلاثي الأبعاد. تظهر التجارب الواسعة أن SRPose يحقق أداءً تنافسياً أو متفوقاً مقارنة بأحدث الطرق من حيث الدقة والسرعة، مما يظهر القدرة على التعميم على كلا السيناريوهين. إنه قوي أمام أحجام الصور المختلفة وخصائص الكاميرا الداخلية، ويمكن نشره باستخدام موارد حوسبة منخفضة.
دراسة روي وآخرون (الخميس) هذا السؤال.