Key points are not available for this paper at this time.
In diesem Papier präsentieren wir neuartige datengestützte Optimierungsmodelle für Support-Vektor-Maschinen (SVM), mit dem Ziel, zwei Datenmengen, die nicht-disjunkte konvexe Hüllen haben, linear zu trennen. Traditionelle Klassifikationsalgorithmen nehmen an, dass die Trainingsdatenpunkte immer genau bekannt sind. In der Realität sind jedoch Daten oft Rauschen ausgesetzt. Um mit solcher Unsicherheit umzugehen, formulieren wir robuste Modelle mit Unsicherheitsmengen in Form von Hyperrechtecken oder Hyperellipsoiden und schlagen ein momentbasiertes distributionsrobustes Optimierungsmodell vor, das Beschränkungen für erste Abweichungen entlang der Hauptachsen durchsetzt. Alle Formulierungen reduzieren sich auf konvexe Programme. Die Effizienz der neuen Klassifizierer wird an realen Datenbanken bewertet. Experimente zeigen, dass robuste Klassifizierer insbesondere bei Datensätzen mit einer kleinen Anzahl von Beobachtungen vorteilhaft sind. Mit zunehmender Dimension der Datensätze wird das Verhalten von Merkmalen allmählich erlernt, und höhere Genauigkeiten außerhalb der Stichprobe können über die betrachtete distributionsrobuste Optimierungsmethode erreicht werden. Die vorgeschlagenen Formulierungen erlauben es insgesamt, einen Kompromiss zwischen der Erhöhung der durchschnittlichen Leistungsgenauigkeit und dem Schutz gegen Unsicherheit im Vergleich zu deterministischen Ansätzen zu finden.
Faccini et al. (Tue,) untersuchten diese Frage.