February 10, 2019Open Access

Combinação de agrupamento de variáveis e seleção de recursos usando florestas aleatórias

Key Points

Key points are not available for this paper at this time.

Abstract

Abordagens padrão para lidar com classificação supervisionada de alta dimensão geralmente incluem seleção de variáveis e redução de dimensões. A metodologia proposta combina agrupamento de variáveis e seleção de recursos. O agrupamento hierárquico de variáveis permite construir grupos de variáveis correlacionadas e resume cada grupo por uma variável sintética. A originalidade é que os grupos de variáveis são desconhecidos a priori. Além disso, a abordagem de agrupamento lida tanto com variáveis numéricas quanto categóricas. Entre todas as possíveis partições, as variáveis sintéticas mais relevantes são selecionadas com um procedimento que utiliza florestas aleatórias. As performances numéricas são ilustradas em conjuntos de dados simulados e reais. A seleção de grupos de variáveis proporciona uma interpretação mais fácil dos resultados.

Combinação de agrupamento de variáveis e seleção de recursos usando florestas aleatórias

Key Points

Abstract

Cite This Study