Key points are not available for this paper at this time.
Da Datensätze weiterhin in der Größe zunehmen, ist es wichtig, die optimale Merkmalsubmenge aus dem ursprünglichen Datensatz auszuwählen, um die beste Leistung bei maschinellen Lernaufgaben zu erzielen. Hochdimensionale Datensätze mit einer übermäßigen Anzahl von Merkmalen können in solchen Aufgaben zu schlechter Leistung führen. Überanpassung ist ein typisches Problem. Darüber hinaus können Datensätze mit hoher Dimensionalität Platzmangel verursachen und hohe Rechenleistung erfordern, und Modelle, die auf solchen Datensätzen trainiert werden, können niedrige Klassifikationsgenauigkeiten liefern. Daher ist es notwendig, eine repräsentative Untermenge von Merkmalen zu wählen, indem eine effiziente Auswahlmethode genutzt wird. Es wurden zahlreiche Methoden zur Merkmalsauswahl vorgeschlagen, darunter die rekursive Merkmaleliminierung. In diesem Papier wird ein hybrides rekursives Merkmaleliminationsverfahren vorgestellt, das die auf der Merkmalswichtigkeit basierenden rekursiven Merkmaleliminierungsmethoden der Support-Vektor-Maschine, des Zufallswaldes und der verallgemeinerten Boosted-Regression-Algorithmen kombiniert. Aus den Experimenten bestätigen wir, dass die Leistung der vorgeschlagenen Methode der der drei einzelnen rekursiven Merkmaleliminierungsmethoden überlegen ist.
Jeon et al. (Mon,) haben diese Frage untersucht.