December 6, 2017Open Access

Seleção de Recursos

Key Points

Key points are not available for this paper at this time.

Abstract

A seleção de recursos, como uma estratégia de pré-processamento de dados, tem se mostrado eficaz e eficiente na preparação de dados (especialmente dados de alta dimensão) para vários problemas de mineração de dados e aprendizado de máquina. Os objetivos da seleção de recursos incluem a construção de modelos mais simples e compreensíveis, a melhoria do desempenho da mineração de dados e a preparação de dados limpos e compreensíveis. A recente proliferação de big data apresentou alguns desafios e oportunidades substanciais para a seleção de recursos. Nesta pesquisa, fornecemos uma visão geral abrangente e estruturada dos avanços recentes na pesquisa de seleção de recursos. Motivados pelos desafios e oportunidades atuais na era do big data, revisitamos a pesquisa de seleção de recursos sob a perspectiva de dados e revisamos algoritmos representativos de seleção de recursos para dados convencionais, dados estruturados, dados heterogêneos e dados em fluxo. Metodologicamente, para enfatizar as diferenças e semelhanças da maioria dos algoritmos de seleção de recursos existentes para dados convencionais, os categorizamos em quatro grupos principais: métodos baseados em similaridade, baseados em teoria da informação, baseados em aprendizado esparso e baseados em estatística. Para facilitar e promover a pesquisa nesta comunidade, também apresentamos um repositório de seleção de recursos de código aberto que consiste na maioria dos algoritmos populares de seleção de recursos (http://featureselection.asu.edu/). Além disso, usamos isso como um exemplo para mostrar como avaliar algoritmos de seleção de recursos. No final da pesquisa, apresentamos uma discussão sobre alguns problemas e desafios abertos que requerem mais atenção em pesquisas futuras.

Bookmark

View Full Paper