January 1, 2000

Verteilungsgleichgewichtete stratified Kreuzvalidierung zur Genauigkeitsschätzung

Key Points

Key points are not available for this paper at this time.

Abstract

Zusammenfassung Die Kreuzvalidierung wurde häufig in der Maschinenlern-Forschung angewendet, um die Genauigkeiten von Klassifikatoren zu schätzen. In dieser Arbeit schlagen wir eine Erweiterung dieser Methode vor, die als verteilungsgleichgewichtete stratified Kreuzvalidierung (DBSCV) bezeichnet wird, die die Schätzqualität verbessert, indem sie ausgewogene Intra-Klassen-Verteilungen bereitstellt, wenn ein Datensatz in mehrere Falten partitioniert wird. Wir haben DBSCV an neun realen und drei künstlichen Domänen unter Verwendung des C4.5 Entscheidungsbaum-Klassifikators getestet. Die Ergebnisse zeigen, dass DBSCV in den meisten Fällen (geringere Verzerrungen) besser abschneidet als die reguläre stratified Kreuzvalidierung, insbesondere wenn die Anzahl der Falten gering ist. Die Analyse und Experimente basierend auf drei künstlichen Datensätzen zeigen auch, dass DBSCV besonders effektiv ist, wenn mehrere Intra-Klassen-Cluster in einem Datensatz vorhanden sind. Schlüsselwörter: KreuzVALIDIERUNG Maschinenlernen Forschung Wahre Genauigkeit Klassifikator

Bookmark

Verteilungsgleichgewichtete stratified Kreuzvalidierung zur Genauigkeitsschätzung

Key Points

Abstract

Cite This Study

Also Consider

Also Consider