Key points are not available for this paper at this time.
Modelar conceitos de consulta através de dependências de termos demonstrou ter um efeito positivo significativo no desempenho de recuperação, especialmente para tarefas como busca na web, onde a relevância em altas classificações é particularmente crítica. No entanto, a maioria dos trabalhos anteriores trata todos os conceitos como igualmente importantes, uma suposição que muitas vezes não se sustenta, especialmente para consultas mais longas e complexas. Neste artigo, mostramos que um dos modelos de dependência de termos existentes mais eficazes pode ser naturalmente estendido atribuindo pesos aos conceitos. Demonstramos que o modelo de dependência ponderada pode ser treinado usando técnicas existentes de aprendizado para classificação, mesmo com um número relativamente pequeno de consultas de treinamento. Nosso estudo compara a eficácia de características endógenas (baseadas na coleção) e exógenas (baseadas em fontes externas) para determinar a importância do conceito. Para testar o modelo de dependência ponderada, realizamos experimentos tanto em corpora TREC disponíveis publicamente quanto em um corpus web proprietário. Nossos resultados experimentais indicam que nosso modelo consistentemente e significativamente supera tanto o modelo padrão de bag-of-words quanto o modelo de dependência de termos não ponderado, e que a combinação de características endógenas e exógenas geralmente resulta na melhor eficácia de recuperação.
Bendersky et al. (Qui,) estudaram esta questão.