Key points are not available for this paper at this time.
Zusammenfassung Die Kreuzvalidierung wurde häufig in der Maschinenlern-Forschung angewendet, um die Genauigkeiten von Klassifikatoren zu schätzen. In dieser Arbeit schlagen wir eine Erweiterung dieser Methode vor, die als verteilungsgleichgewichtete stratified Kreuzvalidierung (DBSCV) bezeichnet wird, die die Schätzqualität verbessert, indem sie ausgewogene Intra-Klassen-Verteilungen bereitstellt, wenn ein Datensatz in mehrere Falten partitioniert wird. Wir haben DBSCV an neun realen und drei künstlichen Domänen unter Verwendung des C4.5 Entscheidungsbaum-Klassifikators getestet. Die Ergebnisse zeigen, dass DBSCV in den meisten Fällen (geringere Verzerrungen) besser abschneidet als die reguläre stratified Kreuzvalidierung, insbesondere wenn die Anzahl der Falten gering ist. Die Analyse und Experimente basierend auf drei künstlichen Datensätzen zeigen auch, dass DBSCV besonders effektiv ist, wenn mehrere Intra-Klassen-Cluster in einem Datensatz vorhanden sind. Schlüsselwörter: KreuzVALIDIERUNG Maschinenlernen Forschung Wahre Genauigkeit Klassifikator
Zeng et al. (Sat.) untersuchten diese Frage.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: