Los puntos clave no están disponibles para este artículo en este momento.
Entrenar la regresión de soporte vectorial (SVR) para problemas a gran escala consume mucho tiempo, incluso con solucionadores de programación cuadrática eficientes. Este problema es particularmente serio cuando se ajustan los parámetros del modelo. Una forma de abordar el problema es reducir la escala del problema seleccionando un subconjunto del conjunto de entrenamiento. Este artículo presenta un método rápido de selección de patrones escaneando el conjunto de datos de entrenamiento para reducir la escala de un problema. En particular, encontramos los k vecinos más cercanos (kNN) en una región local alrededor del valor objetivo de cada patrón y luego determinamos si retener el patrón según la distribución de sus vecinos más cercanos. Hay una alta probabilidad de que el patrón se encuentre fuera del -tubo. Dado que los kNN de un patrón se encuentran en una región muy pequeña, es rápido escanear todo el conjunto de datos de entrenamiento. El método propuesto aborda la predicción del año del conjunto de datos Million Song, que contiene 463 715 patrones, en 10 s en una computadora personal con una CPU Intel Core i5-4690 a 3.50 GHz y 8GB de DRAM. Una ventaja adicional del método propuesto es que puede predefinir el tamaño del subconjunto seleccionado según el conjunto de entrenamiento. Evaluaciones empíricas exhaustivas demuestran que el método propuesto puede eliminar significativamente patrones redundantes para el entrenamiento de SVR con solo una ligera disminución en el rendimiento.
Zhu et al. (Wed,) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: