Key points are not available for this paper at this time.
コーパスベースの自然言語生成 (NLG) における最近の進展は、ドメイン間で容易にポータブルであることを約束していますが、意味表現 (MR) と自然言語 (NL) の発話がペアになったコストのかかるトレーニングデータを必要とします。本研究では、自動品質管理手法を使用し、データを引き出すための異なる MR を評価することで、高品質な NLG トレーニングデータをクラウドソーシングするための新しいフレームワークを提案します。私たちは、画像による MR が論理ベースの MR よりも良い NL データを収集することを示します:画像による MR によって引き出された発話は、論理的な MR を使用した場合と比較して、著しく自然で、より情報を持ち、より良く表現されていると判断され、平均品質評価が有意に増加します(6 段階で約 0.5 ポイント)。MR がより複雑になるほど、画像刺激の利点は増大します。収集されたデータは、この提出の一部として公開されます。
Novikova et al. (Fri,) はこの問題を研究しました。