Key points are not available for this paper at this time.
Informationstheoretische Maße bilden eine grundlegende Klasse von Maßen zum Vergleich von Clusterungen und haben in letzter Zeit zunehmendes Interesse erregt. Dennoch bleiben zahlreiche Fragen zu ihren Eigenschaften und Wechselbeziehungen ungelöst. In diesem Papier führen wir eine organisierte Untersuchung der informationstheoretischen Maße zum Vergleich von Clusterungen durch, einschließlich mehrerer existierender populärer Maße in der Literatur sowie einiger neu vorgeschlagener Maße. Wir diskutieren und beweisen ihre wichtigen Eigenschaften, wie die metrische Eigenschaft und die Normalisierungseigenschaft. Wir heben dann die Bedeutung der Korrektur informationstheoretischer Maße für Zufall hervor, insbesondere wenn die Datenmenge im Vergleich zur Anzahl der darin enthaltenen Cluster klein ist. Von den verfügbaren informationstheoretischen basierten Maßen befürworten wir die normierte Informationsdistanz (NID) als allgemeines Maß der Wahl, da sie gleichzeitig mehrere wichtige Eigenschaften besitzt, wie beispielsweise sowohl ein metrisches als auch ein normiertes Maß zu sein, eine genaue analytische Form, die für Zufall angepasst ist, zuzulassen und den nominalen Bereich 0,1 besser zu nutzen als andere normierte Varianten.
Vinh et al. (Mon,) untersuchten diese Frage.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: