Los puntos clave no están disponibles para este artículo en este momento.
El submuestreo es un método ampliamente adoptado para abordar problemas de clasificación de patrones con desbalance. Los métodos actuales dependen principalmente de realizar re-muestreo aleatorio en la clase mayoritaria o de re-muestreo en el límite de decisión. El submuestreo basado en aleatoriedad no toma en consideración las muestras informativas en los datos, mientras que el re-muestreo en el límite de decisión es sensible a la superposición de clases. Ambas técnicas ignoran la información de distribución del conjunto de datos de entrenamiento. En este artículo, proponemos un método de submuestreo basado en sensibilidad diversificada. Se agrupan muestras de la clase mayoritaria para capturar la información de distribución y mejorar la diversidad del re-muestreo. Se aplica una medida de sensibilidad estocástica para seleccionar muestras de ambos clústeres de la clase mayoritaria y la clase minoritaria. Al agrupar y muestrear de manera iterativa, se selecciona un conjunto equilibrado de muestras que producen una alta sensibilidad del clasificador. El método propuesto ofrece una buena capacidad de generalización para 14 conjuntos de datos de UCI.
Ng et al. (Tue,) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: