الملخص تشكل التقنيات المتطورة لإنشاء الفيديوهات المزيفة العميقة تحديات جسيمة لصحة الوسائط الرقمية، مع مخاطر محتملة تشمل الخصوصية والأمن والمعلومات المضللة. أظهرت طرق التعلم العميق (DL) وعداً كبيراً في الكشف عن مثل هذه التلاعبات؛ ومع ذلك، تعوق التفاوتات في التطبيق، وعدم وجود مسارات معيارية، والضعف في التعميم عبر مجموعات البيانات استخدام هذه الطرق بشكل موثوق في السيناريوهات الواقعية. تقدم هذه الدراسة تقييماً شاملاً لمعمارية المحول والـCNN للكشف عن الفيديوهات المزيفة العميقة. تم استخدام عدة مجموعات بيانات معيارية، إلى جانب مجموعة بيانات جديدة لإعادة تمثيل الوجوه، لدراسة التعميم عبر المجموعات والتمهيد مع تعديل محدود على مجموعات الهدف الصغيرة (10-30%). بالإضافة إلى ذلك، نحلل تأثير طول النافذة الزمنية على أداء الكشف. تظهر النتائج التجريبية أن نموذج TimeSformer يحقق أداءً عالياً بثبات، حيث يصل إلى دقة 78.4%، ومساحة تحت المنحنى (AUC) 0.801، ونتيجة F1 بمقدار 77.0% مع مقاطع مكونة من 96 إطارًا وتعديل بنسبة 30%، مما يؤكد ميزة النمذجة المشتركة الفراغية والزمانية. تستفيد جميع النماذج من تعديل معتدل، مع ثبات المكاسب بعد 20%. يؤدي زيادة طول المقطع إلى تحسين الأداء لدى النماذج التي تأخذ بالاعتبار البعد الزمني، مما يبرز أهمية السياق الزمني الممتد. بشكل عام، توفر هذه الدراسة أدلة تجريبية على نقاط القوة والقيود في المعماريات الحالية، مما يقدم إرشادات للبحوث المستقبلية والتطبيق العملي لكاشفات الفيديوهات المزيفة العميقة القوية والقابلة للتعميم.
Building similarity graph...
Analyzing shared references across papers
Loading...
Georgios Petmezas
Machine Vision and Applications
University of Western Macedonia
Building similarity graph...
Analyzing shared references across papers
Loading...
درس جورجيوس بيتميزاس (Tue,) هذا السؤال.
synapsesocial.com/papers/69d895206c1944d70ce0619d — DOI: https://doi.org/10.1007/s00138-026-01809-w
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: