January 1, 2018Open Access

質問応答における心の理論の評価

Key Points

Key points are not available for this paper at this time.

Abstract

私たちは、信念について推論する能力に関して質問応答モデルを評価するための新しいデータセットを提案します。私たちのタスクは、子供たちが他者の信念について推論できるかどうかを調べる心の理論実験に触発されています。特に、これらの信念が現実と異なる場合です。私たちは、メモリ拡張を伴う最近の多数の神経モデルを評価しました。すべてが、世界の矛盾する状態を追跡する必要があるタスクで失敗することがわかりました。さらに、テスト時にランダムな文がタスクに導入されると、モデルの精度は顕著に低下します。1

AIに質問

Bookmark

View Full Paper