August 26, 2001

Un algoritmo de conjunto en streaming (SEA) para clasificación a gran escala

Puntos clave

Los puntos clave no están disponibles para este artículo en este momento.

Resumen

Los métodos de conjunto han atraído recientemente una gran atención en la comunidad de aprendizaje automático. Técnicas como Boosting y Bagging han demostrado ser muy efectivas, pero requieren un muestreo repetido de los datos de entrenamiento, lo que las hace inapropiadas en un contexto de minería de datos. Los métodos presentados en este documento aprovechan los datos abundantes, construyendo clasificadores separados en segmentos secuenciales de puntos de entrenamiento. Estos clasificadores se combinan en un conjunto de tamaño fijo utilizando una estrategia de reemplazo heurística. El resultado es un algoritmo rápido para datos a gran escala o en streaming que clasifica tan bien como un solo árbol de decisión construido con todos los datos, requiere aproximadamente memoria constante y se ajusta rápidamente al cambio de concepto.

Me gusta

Guardar

Me gusta

Guardar

Un algoritmo de conjunto en streaming (SEA) para clasificación a gran escala

Puntos clave

Resumen

Cite This Study