July 9, 2021Open Access

Eine Umfrage über unüberwachte generative Modelle für explorative Datenanalyse und Repräsentationslernen

Key Points

Key points are not available for this paper at this time.

Abstract

Seit mehr als einem Jahrhundert haben sich die Methoden zur Datenrepräsentation und zur Erforschung der intrinsischen Strukturen von Daten bemerkenswert entwickelt und bestehen aus überwachten und unbeaufsichtigten Methoden. In den letzten Jahren haben wir jedoch das Aufblühen von Big Data erlebt, bei dem die typischen Dimensionen von Datensätzen hoch sind und die Daten in unordentlichen, unvollständigen, nicht gekennzeichneten oder beschädigten Formen vorliegen können. Folglich wird das Entdecken der verborgenen Struktur, die in solchen Daten vergraben ist, äußerst herausfordernd. Aus dieser Perspektive spielt die explorative Datenanalyse eine wesentliche Rolle beim Lernen der verborgenen Strukturen, die die bedeutenden Merkmale der Daten in geordneter Weise umfassen, indem sie Muster extrahiert und Hypothesen testet, um Anomalien zu identifizieren. Unüberwachte generative Lernmodelle sind eine Klasse von maschinellen Lernmodellen, die durch ihr Potenzial zur Dimensionsreduktion, zum Entdecken der explorativen Faktoren und zum Lernen von Repräsentationen ohne vorab definierte Labels gekennzeichnet sind; darüber hinaus können solche Modelle die Daten aus dem Bereich der reduzierten Faktoren generieren. In dieser Umfrage finden Anfängerforscher die aktuellen unüberwachten generativen Lernmodelle zum Zwecke der Datenexploration und des Lernens von Repräsentationen; speziell behandelt dieser Artikel drei Familien von Methoden basierend auf ihrer Verwendung im Zeitalter von Big Data: blinde Quelltrennung, Mannigfaltigkeitslernen und neuronale Netzwerke, von flachen bis hin zu tiefen Architekturen.

KI fragen

Bookmark

View Full Paper