Key points are not available for this paper at this time.
Les modèles de reconnaissance faciale (FR) sont entraînés sur des jeux de données à grande échelle, qui soulèvent des problèmes de confidentialité et d'éthique. Récemment, l'utilisation de données synthétiques pour compléter ou remplacer des données authentiques pour l'entraînement des modèles FR a été proposée. Bien que des résultats prometteurs aient été obtenus, il reste encore incertain si les modèles génératifs peuvent produire des données suffisamment diversifiées pour de telles tâches. Dans ce travail, nous introduisons une nouvelle méthode, inspirée du mouvement physique des particules molles soumises à des forces browniennes stochastiques, nous permettant d'échantillonner des distributions d'identités dans un espace latent sous diverses contraintes. Avec cela en main, nous générons plusieurs jeux de données de visages et les évaluons en entraînant des modèles FR, montrant que les données générées avec notre méthode surpassent les performances des jeux de données précédemment basés sur les GAN et atteignent des performances compétitives avec les jeux de données synthétiques basés sur la diffusion à la pointe de la technologie. Nous montrons également que cette méthode peut être utilisée pour atténuer les fuites provenant de l'ensemble d'entraînement du générateur et explorer la capacité des modèles génératifs à générer des données au-delà.
Geissbühler et al. (Tue,) ont étudié cette question.