December 3, 2014Open Access

Tief erlernte Gesichtsrepräsentationen sind spärlich, selektiv und robust

Key Points

Key points are not available for this paper at this time.

Abstract

Dieses Papier entwirft ein leistungsstarkes tiefes Faltungsnetzwerk (DeepID2+) zur Gesichtserkennung. Es wird mit dem Identifikations- und Verifizierungssignal gelernt. Durch die Erhöhung der Dimension der verborgenen Repräsentationen und die Hinzufügung von Aufsicht zu frühen Faltungsschichten erreicht DeepID2+ neue Bestwerte bei den Benchmarks LFW und YouTube Faces. Durch empirische Studien haben wir drei Eigenschaften seiner tiefen neuronalen Aktivierungen entdeckt, die entscheidend für die hohe Leistung sind: Spärlichkeit, Selektivität und Robustheit. (1) Es wurde beobachtet, dass neuronale Aktivierungen moderat spärlich sind. Moderat spärliche Aktivierung maximiert die diskriminative Kraft des tiefen Netzes sowie den Abstand zwischen Bildern. Es ist überraschend, dass DeepID2+ immer noch eine hohe Erkennungsgenauigkeit erreichen kann, selbst nachdem die neuronalen Antworten binarisiert wurden. (2) Seine Neuronen in höheren Schichten sind stark selektiv gegenüber Identitäten und identitätsbezogenen Attributen. Wir können verschiedene Neuronensubsets identifizieren, die entweder ständig erregt oder gehemmt sind, wenn unterschiedliche Identitäten oder Attribute vorhanden sind. Obwohl DeepID2+ nicht beigebracht wird, Attribute während des Trainings zu unterscheiden, hat es implizit solche Hochkonzepte gelernt. (3) Es ist viel robuster gegenüber Okklusionen, obwohl Okklusionsmuster nicht im Trainingssatz enthalten sind.

Bookmark

View Full Paper

Bookmark

View Full Paper

Tief erlernte Gesichtsrepräsentationen sind spärlich, selektiv und robust

Key Points

Abstract

Cite This Study