Die topologische Datenanalyse ist ein Satz von Techniken, die entwickelt wurden, um effizient und robust implizite Strukturen in komplexen Datensätzen herauszustellen. Diese Techniken bestehen darin, einen topologischen Deskriptor für jedes Element eines Datensatzes zu berechnen, indem die wesentlichen topologischen Merkmale prägnant kodiert werden. Ein häufig verwendetes Beispiel ist das Persistenzdiagramm. Obwohl es sich um prägnante Darstellungen handelt, können Persistenzdiagramme erheblichen Speicherplatz erfordern und manchmal zu komplex sein, um sie einfach zu analysieren. In dieser Dissertation ist es unser Ziel, eine Kodierungsmethode für eine Menge von Persistenzdiagrammen zu entwickeln, während wir deren beschreibende Kraft erhalten. Wir beginnen mit der Entwicklung einer nichtlinearen Diktionärkodierung für Persistenzdiagramme. Anschließend verstärken wir unseren Ansatz, indem wir ihn robuster gegenüber Ausreißern innerhalb einer Menge von Persistenzdiagrammen machen, unter Verwendung robuster Baryzentren. Dieser Dictionary-Ansatz beinhaltet die Berechnung von Wasserstein-Distanzen, die in Bezug auf die Eingabediagrammgröße als rechenintensiv bekannt sind. Eine Möglichkeit, dieses Problem zu umgehen, besteht darin, den optimalen Transport mit Schnitten zu verwenden, genauer gesagt die geschnittene Wasserstein-Distanz (Sliced Wasserstein). Wir präsentieren Anwendungen dieser Arbeit zur Datenreduktion, um eine Menge von Persistenzdiagrammen weiter zu komprimieren; zur Dimensionsreduktion, indem wir eine flache Ansicht erstellen, die einen Überblick über die Anordnung der Daten gibt; und zur Robustheit gegenüber Ausreißern im Rahmen eines unüberwachten Clusteringproblems.
Building similarity graph...
Analyzing shared references across papers
Loading...
Keanu Sisouk
Centre National de la Recherche Scientifique
Building similarity graph...
Analyzing shared references across papers
Loading...
Keanu Sisouk (Fri,) untersuchte diese Frage.