El análisis de clústeres visuales es una tarea central para explorar datos multidimensionales. Las técnicas de Reducción de Dimensionalidad (DR) apoyan esta tarea al espacializar las similitudes de datos multidimensionales (MD) como patrones de puntos en diagramas de dispersión. Sin embargo, distorsiones inevitables de vecinos falsos y faltantes limitan su precisión. Por ejemplo, los vecinos falsos hacen que clústeres de datos verdaderamente separados aparezcan como si se superpusieran en el diseño, mientras que los vecinos faltantes dividen clústeres verdaderos en grupos falsamente separados. En general, ambos tipos de distorsiones existen en los diseños de DR, excepto en proyecciones lineales ortogonales (OLP) que solo generan vecinos falsos. En este trabajo, proponemos Reducciones de Dimensionalidad Basadas en Seración Isométrica (ISilDR) que demostrablemente generan como máximo vecinos faltantes. Estudiamos cómo ISilDR y OLP juntos podrían aprovecharse para descubrir verdaderos clústeres MD. Un ISilDR primero crea una seración de los puntos de datos MD, es decir, un orden a lo largo de un eje de proyección unidimensional, y luego cada par de puntos consecutivos a lo largo de este eje se espacia por su distancia MD. Un ISilDR mD puede obtenerse combinando m ISilDRs unidimensionales. Estudiamos las características teóricas y empíricas de diferentes variantes de ISilDRs y OLPs y proponemos un análisis sistemático y formal basado en grafos de vecindad E. A partir de ahí, derivamos reglas para descubrir patrones de clústeres en datos MD a partir de la vinculación interactiva de ISilDR y diseños coordinados OLP. Luego llevamos a cabo estudios de caso e ilustramos escenarios para un análisis visual de clústeres confiable utilizando una combinación de ISilDR y otras técnicas clásicas de DR.
Cutura et al. (jueves) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: