Key points are not available for this paper at this time.
Wir stellen das erste umfangreiche Korpus für langfristige Fragenbeantwortung vor, eine Aufgabe, die elaborierte und tiefgehende Antworten auf offene Fragen erfordert. Das Dataset umfasst 270.000 Threads aus dem Reddit-Forum "Explain Like I'm Five" (ELI5), in dem eine Online-Community Antworten auf Fragen bietet, die von fünfjährigen Kindern verstanden werden. Im Vergleich zu bestehenden Datensätzen umfasst ELI5 vielfältige Fragen, die mehrsatzige Antworten erfordern. Wir stellen eine große Menge an Webdokumenten zur Verfügung, um die Frage zu beantworten. Automatische und menschliche Bewertungen zeigen, dass ein abstrakt trainiertes Modell mit einem Multi-Task-Ziel herkömmliche Seq2Seq-, Sprachmodellierungs- sowie ein starkes extraktives Baseline-Modell übertrifft. Unser bestes Modell liegt jedoch immer noch weit von der menschlichen Leistung entfernt, da die Bewerter in über 86 % der Fälle goldene Antworten bevorzugen, was reichlich Gelegenheit für zukünftige Verbesserungen lässt.
Fan et al. (Tue,) haben diese Frage untersucht.