Key points are not available for this paper at this time.
Dans cet article, nous présentons de nouveaux modèles d'optimisation basés sur les données pour les machines à vecteurs de support (SVM), visant à séparer linéairement deux ensembles de points ayant des fermetures convexes non disjointes. Les algorithmes de classification traditionnels supposent que les points de données d'entraînement sont toujours connus avec précision. Cependant, les données de la vie réelle sont souvent sujettes au bruit. Pour gérer cette incertitude, nous formulons des modèles robustes avec des ensembles d'incertitude sous forme d'hyperrectangles ou d'hyperellipsoïdes, et proposons un modèle d'optimisation distributionnellement robuste basé sur les moments imposant des limites sur les déviations de premier ordre le long des directions principales. Toutes les formulations se réduisent à des programmes convexes. L'efficacité des nouveaux classificateurs est évaluée sur des bases de données réelles. Les expériences montrent que les classificateurs robustes sont particulièrement bénéfiques pour les ensembles de données avec un petit nombre d'observations. À mesure que la dimension des ensembles de données augmente, le comportement des caractéristiques est progressivement appris et des niveaux plus élevés de précision hors échantillon peuvent être atteints grâce à la méthode d'optimisation distributionnellement robuste considérée. Les formulations proposées, dans l'ensemble, permettent de trouver un compromis entre l'augmentation de la précision de performance moyenne et la protection contre l'incertitude, par rapport aux approches déterministes.
Faccini et al. (Mardi,) ont étudié cette question.