Key points are not available for this paper at this time.
Rangierte Abfragen werden verwendet, um relevante Dokumente in Textdatenbanken zu lokalisieren. In einer rangierten Abfrage wird eine Liste von Begriffen angegeben, dann werden die Dokumente zurückgegeben, die am ehesten mit der Abfrage übereinstimmen – in absteigender Reihenfolge der Ähnlichkeit – als Antworten. Entscheidend für die Wirksamkeit rangierter Abfragen ist die Verwendung einer Ähnlichkeitsheuristik, einem Mechanismus, der eine numerische Punktzahl zuweist, die angibt, wie eng ein Dokument und die Abfrage übereinstimmen. In dieser Notiz erkunden und kategorisieren wir eine Reihe von Ähnlichkeitsheuristiken, die in der Literatur beschrieben sind. Wir haben all diese Maßnahmen auf strukturierte Weise implementiert und Experimente zur Abrufung mit einer erheblichen Teilmenge dieser Maßnahmen durchgeführt. Unser Ziel mit dieser Arbeit ist dreifach: Erstens, indem wir die verschiedenen Maßnahmen in einem orthogonalen Rahmen auflisten, machen wir es anderen Forschern leicht, Ähnlichkeitsmaßstäbe zu beschreiben und zu diskutieren; zweitens hoffen wir durch Experimente mit einer breiten Palette von Maßnahmen, zu beobachten, welche Merkmale ein gutes Abrufverhalten in verschiedenen Abrufumgebungen erzeugen; und drittens, indem wir unsere bisherigen Ergebnisse beschreiben, um Feedback zu den Problemen zu sammeln, die wir aufgedeckt haben. Wir zeigen, dass es überraschend schwierig ist, zu identifizieren, welche Techniken am besten funktionieren, und kommentieren die experimentelle Methodik, die erforderlich ist, um Ansprüche auf die Überlegenheit einer Methode gegenüber einer anderen zu unterstützen.
Zobel et al. (Wed,) haben diese Frage untersucht.