Key points are not available for this paper at this time.
تعد مجموعات بيانات الوجه الكبيرة مهمة لتقدم أبحاث التعرف على الوجه، لكنها تتطلب جهدًا كبيرًا في البناء، لأن الكثير من العمل يجب أن يتم لتنظيف الكمية الضخمة من البيانات الخام. لتسهيل هذه المهمة، نقوم بوصف نهج لبناء مجموعات بيانات الوجه يبدأ بالكشف عن الوجوه في الصور التي تُرجع من عمليات البحث عن الشخصيات العامة على الإنترنت، يلي ذلك التخلص من الوجوه التي لا تنتمي إلى كل شخص تم الاستعلام عنه. نقوم بصياغة مشكلة تحديد الوجوه التي يجب إزالتها كمشكلة برمجة تربيعية، تستفيد من الملاحظات القائلة بأن وجوه نفس الشخص يجب أن تبدو متشابهة، وأن تكون لها نفس الجنس، وعادة ما تظهر بحد أقصى مرة واحدة في كل صورة. تظهر نتائجنا أن هذا الأسلوب يمكن أن ينظف مجموعة بيانات كبيرة بشكل موثوق، مما يؤدي إلى تقليل كبير في العمل اللازم لبنائها. وأخيراً، نحن بصدد إصدار مجموعة بيانات FaceScrub التي تم إنشاؤها باستخدام هذا النهج. تتكون من 141,130 وجهًا لـ 695 شخصية عامة ويمكن الحصول عليها من http://vintage.winklerbros.net/facescrub.html.
درس Ng وآخرون (الأربعاء) هذا السؤال.