January 1, 2016Open Access

クラウドソーシング NLG データ：画像がより良いデータを引き出す。

Key Points

Key points are not available for this paper at this time.

Abstract

コーパスベースの自然言語生成 (NLG) における最近の進展は、ドメイン間で容易にポータブルであることを約束していますが、意味表現 (MR) と自然言語 (NL) の発話がペアになったコストのかかるトレーニングデータを必要とします。本研究では、自動品質管理手法を使用し、データを引き出すための異なる MR を評価することで、高品質な NLG トレーニングデータをクラウドソーシングするための新しいフレームワークを提案します。私たちは、画像による MR が論理ベースの MR よりも良い NL データを収集することを示します：画像による MR によって引き出された発話は、論理的な MR を使用した場合と比較して、著しく自然で、より情報を持ち、より良く表現されていると判断され、平均品質評価が有意に増加します（6 段階で約 0.5 ポイント）。MR がより複雑になるほど、画像刺激の利点は増大します。収集されたデータは、この提出の一部として公開されます。

AIに質問

Bookmark

View Full Paper