Los puntos clave no están disponibles para este artículo en este momento.
Los métodos de conjunto han atraído recientemente una gran atención en la comunidad de aprendizaje automático. Técnicas como Boosting y Bagging han demostrado ser muy efectivas, pero requieren un muestreo repetido de los datos de entrenamiento, lo que las hace inapropiadas en un contexto de minería de datos. Los métodos presentados en este documento aprovechan los datos abundantes, construyendo clasificadores separados en segmentos secuenciales de puntos de entrenamiento. Estos clasificadores se combinan en un conjunto de tamaño fijo utilizando una estrategia de reemplazo heurística. El resultado es un algoritmo rápido para datos a gran escala o en streaming que clasifica tan bien como un solo árbol de decisión construido con todos los datos, requiere aproximadamente memoria constante y se ajusta rápidamente al cambio de concepto.
Street et al. (Sun,) estudiaron esta cuestión.