Zusammenfassung Trotz des inhärenten Fehlens einer Ground Truth in der Clusteranalyse wird ein breiter Konsens über die Definition des Begriffs Cluster im kontinuierlichen Kontext allgemein anerkannt. Im Gegensatz dazu bleibt dies in Anwesenheit von kategorischen Daten umstritten. Wir schlagen eine neuartige Vorstellung von Clustern vor, die auf den dualen Konzepten von hoher Frequenz und variabler Assoziation basiert. Wir zeigen, wie dieses Konzept mit der Clusterdefinition übereinstimmt, die durch das modale Clustering im kontinuierlichen Bereich bereitgestellt wird, und wie wir bestehende operationale Werkzeuge ausleihen und anpassen können, um ein neuartiges Verfahren zu entwickeln, das automatisch die Anzahl der Cluster bestimmt. Die Methode wird anhand realer Daten veranschaulicht und durch Simulationen getestet.
Corsini et al. (Thu,) untersuchten diese Frage.