April 1, 2024Open Access

Was verursacht das Versagen bei der Erkennung von expliziten und impliziten Diskursbeziehungen?

Key Points

Key points are not available for this paper at this time.

Abstract

Wir betrachten eine unbeantwortete Frage in der Gemeinschaft der Diskursverarbeitung: Warum schneiden Beziehungsklassifizierer, die auf expliziten Beispielen trainiert wurden (mit entfernten Konnektoren), in echten impliziten Szenarien schlecht ab? Frühere Arbeiten behaupteten, dies liege an der linguistischen Dissimilarität zwischen expliziten und impliziten Beispielen, lieferten jedoch keine empirischen Beweise. In dieser Studie zeigen wir, dass eine Ursache für dieses Versagen ein Label-Shift nach der Eliminierung der Konnektoren ist. Konkret stellen wir fest, dass die Diskursbeziehungen, die von einigen expliziten Instanzen ausgedrückt werden, sich ändern, wenn Konnektoren verschwinden. Im Gegensatz zu früheren Arbeiten, die manuell einige Beispiele analysierten, präsentieren wir empirische Beweise auf Korpusebene, um das Vorhandensein eines solchen Shifts zu beweisen. Dann analysieren wir, warum ein Label-Shift auftritt, indem wir Faktoren wie die syntaktische Rolle der Konnektoren, die Mehrdeutigkeit der Konnektoren und mehr betrachten. Schließlich untersuchen wir zwei Strategien zur Minderung des Label-Shifts: das Herausfiltern von störenden Daten und das gemeinsame Lernen mit Konnektoren. Experimente zu PDTB 2.0, PDTB 3.0 und dem GUM-Datensatz zeigen, dass Klassifizierer, die mit unseren Strategien trainiert wurden, starke Baselines übertreffen.

Read Full Paperexternally

KI fragen

Bookmark

View Full Paper