August 28, 2024Open Access

大規模言語モデルによる構造化イベント推論

Key Points

Key points are not available for this paper at this time.

Abstract

現実のイベントに関する推論は、AIとNLPにおける統一的な課題であり、さまざまな分野で深い実用性を持っていますが、高リスクなアプリケーションにおける誤りは壊滅的な結果を招く可能性があります。これらの分野で多様なテキストを扱うことができる大規模言語モデル（LLM）は、質問に答えたり問題を解決したりする能力を示しています。しかし、エンドツーエンドのLLMは依然として複雑なイベントについての推論を体系的に失敗し、ブラックボックス的性質のために解釈可能性を欠いていることを示します。これらの問題に対処するために、私はLLMをイベントの構造化表現と組み合わせて使用するための3つの一般的なアプローチを提案します。第一は、LLMがファインチューニングを通じて学習できるサブイベントの関係を含む言語ベースの表現です。第二は、LLMが数ショットのプロンプトを通じて予測し活用できるエンティティの状態を含む半記号表現です。第三は、構造化データでトレーニングされたLLMによって予測され、記号的ソルバーによって実行される完全記号表現です。常識推論とプランニングを含む一連のイベント推論タスクに対して、各アプローチがエンドツーエンドのLLMよりも大幅に優れた性能を発揮し、より解釈可能であることを示します。これらの結果は、イベント推論やその先に向けたLLMと構造化表現の間の相乗効果の方法を示唆しています。

大規模言語モデルによる構造化イベント推論

Key Points

Abstract

Cite This Study