Entender a organização de dados de alta dimensão é de interesse primário para muitos ramos das ciências aplicadas. Isso é tipicamente alcançado por meio da aplicação de técnicas de redução de dimensionalidade que, enquanto preservam características locais, frequentemente perdem a estrutura global do conjunto de dados. Técnicas de agrupamento são outra classe de métodos que operam no espaço ambiente, agrupando pontos similares. No entanto, ao contrário das técnicas de redução de dimensionalidade, elas não fornecem informações sobre a organização dos dados. Aproveitando ideias da Análise Topológica de Dados, neste artigo fornecemos uma camada adicional sobre a saída de qualquer algoritmo de agrupamento. Tal estrutura de dados, ClusterGraph, fornece informações sobre o layout global dos clusters, obtidas a partir do algoritmo de agrupamento escolhido. Medidas apropriadas são fornecidas para avaliar a qualidade e utilidade da representação obtida. Subsequentemente, o ClusterGraph, possivelmente com uma simplificação que preserve a estrutura apropriada, pode ser visualizado e usado em sinergia com técnicas de análise exploratória de dados de última geração.
Dłotko et al. (Sat,) estudaram esta questão.