Key points are not available for this paper at this time.
نقدم نهجًا لاسترداد الشبكة البشرية العالمية ثلاثية الأبعاد من مقاطع الفيديو أحادية العين المسجلة باستخدام كاميرات ديناميكية. نهجنا قوي ضد حالات الازدواجية الشديدة وطويلة المدى ويتعقب أجسام البشر حتى عندما تخرج عن مجال رؤية الكاميرا. لتحقيق ذلك، نقترح أولاً مُدخل حركة توليد عميق، يقوم بملء حركات أجسام البشر المزدوجة بناءً على الحركات المرئية. بالإضافة إلى ذلك، على عكس الأعمال السابقة، يقوم نهجنا بإعادة بناء الشبكات البشرية في إحداثيات عالمية متسقة حتى مع الكاميرات الديناميكية. نظرًا لأن إعادة بناء حركات البشر ووضعيات الكاميرات مشروطة بشكل غير كافٍ، نقترح متنبئًا لمسار عالمي ينتج مسارات بشرية عالمية بناءً على حركات الجسم المحلية. باستخدام المسارات المتوقعة كمرتكزات، نقدم إطار عمل لتحسين عالمي يقوم بتنقيح المسارات المتوقعة وتحسين وضعيات الكاميرات لتتناسب مع أدلة الفيديو مثل نقاط المفاتيح ثنائية الأبعاد. تظهر التجارب على مجموعات البيانات الداخلية والتحديات في البرية مع الكاميرات الديناميكية أن النهج المقترح يتفوق بشكل ملحوظ على الطرق السابقة من حيث ملء الحركات واسترداد الشبكة العالمية.
درس يوان وآخرون (الأربعاء) هذا السؤال.