Key points are not available for this paper at this time.
نقدم VIDIM، نموذجًا توليديًا للاستيفاء بالفيديو، يقوم بإنشاء مقاطع فيديو قصيرة بناءً على إطار البداية والنهاية. لتحقيق دقة عالية وتوليد حركات غير مرئية في بيانات الإدخال، يستخدم VIDIM نماذج انتشار متتالية لتوليد الفيديو المستهدف أولاً بدقة منخفضة، ثم توليد الفيديو عالي الدقة اعتمادًا على الفيديو منخفض الدقة الذي تم توليده. نقارن VIDIM بالطرق الحديثة السابقة في الاستيفاء بالفيديو، ونوضح كيف تفشل هذه الطرق في معظم الحالات التي يكون فيها الحركة الأساسية معقدة أو غير خطية أو غامضة، بينما يمكن لـ VIDIM التعامل مع مثل هذه الحالات بسهولة. نُظهر أيضًا كيف أن التوجيه بدون مصنف على إطار البداية والنهاية وتكييف نموذج الزيادة الفائقة الدقة باستخدام الإطارات الأصلية عالية الدقة دون معلمات إضافية يفتح الباب أمام نتائج عالية الدقة. يعد VIDIM سريعًا في العينة حيث ينظف جميع الإطارات المطلوب توليدها معًا، ويتطلب أقل من مليار معلمة لكل نموذج انتشار لإنتاج نتائج مقنعة، كما يتمتع بإمكانية التوسع وتحسين الجودة مع زيادة عدد المعلمات.
قام جاين وآخرون (مون،) بدراسة هذا السؤال.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: