February 4, 2010Open Access

Importância do conceito de aprendizado usando um modelo de dependência ponderada

Key Points

Key points are not available for this paper at this time.

Abstract

Modelar conceitos de consulta através de dependências de termos demonstrou ter um efeito positivo significativo no desempenho de recuperação, especialmente para tarefas como busca na web, onde a relevância em altas classificações é particularmente crítica. No entanto, a maioria dos trabalhos anteriores trata todos os conceitos como igualmente importantes, uma suposição que muitas vezes não se sustenta, especialmente para consultas mais longas e complexas. Neste artigo, mostramos que um dos modelos de dependência de termos existentes mais eficazes pode ser naturalmente estendido atribuindo pesos aos conceitos. Demonstramos que o modelo de dependência ponderada pode ser treinado usando técnicas existentes de aprendizado para classificação, mesmo com um número relativamente pequeno de consultas de treinamento. Nosso estudo compara a eficácia de características endógenas (baseadas na coleção) e exógenas (baseadas em fontes externas) para determinar a importância do conceito. Para testar o modelo de dependência ponderada, realizamos experimentos tanto em corpora TREC disponíveis publicamente quanto em um corpus web proprietário. Nossos resultados experimentais indicam que nosso modelo consistentemente e significativamente supera tanto o modelo padrão de bag-of-words quanto o modelo de dependência de termos não ponderado, e que a combinação de características endógenas e exógenas geralmente resulta na melhor eficácia de recuperação.

Bookmark

Importância do conceito de aprendizado usando um modelo de dependência ponderada

Key Points

Abstract

Cite This Study