Key points are not available for this paper at this time.
Diese Arbeit präsentiert einen Referenzdatensatz, CQADupStack, zur Verwendung in der Forschung zu Community Question Answering (cQA). Er enthält Threads aus zwölf StackExchange-Subforen, die mit Informationen zu doppelten Fragen annotiert sind. Wir bieten vordefinierte Trainings- und Testsplits sowohl für Retrieval- als auch für Klassifikationsexperimente an, um maximale Vergleichbarkeit zwischen verschiedenen Studien zu gewährleisten, die mit diesem Datensatz arbeiten. Darüber hinaus kommt er mit einem Skript, um die Daten auf verschiedene Weise zu manipulieren. Wir geben eine Analyse der Daten im Datensatz und berichten über Benchmark-Ergebnisse zu einer Aufgabe der doppelten Frage-Retrieval unter Verwendung etablierter Retrieval-Modelle.
Hoogeveen et al. (Mon,) untersuchten diese Frage.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: