Key points are not available for this paper at this time.
Abordagens padrão para lidar com classificação supervisionada de alta dimensão geralmente incluem seleção de variáveis e redução de dimensões. A metodologia proposta combina agrupamento de variáveis e seleção de recursos. O agrupamento hierárquico de variáveis permite construir grupos de variáveis correlacionadas e resume cada grupo por uma variável sintética. A originalidade é que os grupos de variáveis são desconhecidos a priori. Além disso, a abordagem de agrupamento lida tanto com variáveis numéricas quanto categóricas. Entre todas as possíveis partições, as variáveis sintéticas mais relevantes são selecionadas com um procedimento que utiliza florestas aleatórias. As performances numéricas são ilustradas em conjuntos de dados simulados e reais. A seleção de grupos de variáveis proporciona uma interpretação mais fácil dos resultados.
Chavent et al. (Sun,) estudaram essa questão.