January 1, 2022Open Access

BRIO: Trazendo Ordem à Resumissão Abstrativa

Key Points

Key points are not available for this paper at this time.

Abstract

Modelos de resumissão abstrativa são comumente treinados usando estimativa de máxima verossimilhança, que assume uma distribuição de alvo determinística (um ponto) na qual um modelo ideal atribuirá toda a massa de probabilidade ao resumo de referência. Essa suposição pode levar à degradação do desempenho durante a inferência, onde o modelo precisa comparar vários resumos gerados pelo sistema (candidatos) que se desviaram do resumo de referência. Para abordar esse problema, propomos um novo paradigma de treinamento que assume uma distribuição não determinística, de modo que diferentes resumos candidatos recebam massa de probabilidade de acordo com sua qualidade. Nosso método alcança um novo resultado de ponta nos conjuntos de dados CNN/DailyMail (47.78 ROUGE-1) e XSum (49.07 ROUGE-1). Análises adicionais também mostram que nosso modelo pode estimar probabilidades de resumos candidatos que são mais correlacionadas com seu nível de qualidade. 1

Bookmark

View Full Paper