August 10, 2024Open Access

食品コンピューティングにおける固有表現認識の再考：パフォーマンスと堅牢性の向上

Key Points

革新的なモデルを通じて成分認識の精度が向上し、顕著な進展を示しています。
性能評価は、私たちのモデルがベンチマークを上回り、多様なデータセットで優れた結果を達成していることを示しています。
ガウス混合モデルを活用した分析は、タグ付けされていない成分エントリからの学習を効果的に改善し、データの質の問題に対する堅牢性を高めることを示しています。知的なレシピ推奨における広範な影響は、パーソナライズされた食品体験に対する重要な可能性を示唆しています。

Abstract

常に進化する食品コンピューティングの領域において、固有表現認識（NER）はレシピにおける単なる単語タグ付けを超えた変革的な可能性を示しています。その影響には、知的なレシピ推奨、健康分析、パーソナライズが含まれます。しかし、食品コンピューティングにおける既存のNERモデルは、レシピ入力標準の変動、限られた注釈、データセットの質などから生じる課題に直面しています。本稿では、成分NERの特定の問題に取り組み、効率的で堅牢なモデルSINERAと、タグ付けされていない成分リストエントリから学習するガウス混合モデル（GMM）を利用した半教師ありバリアントSINERASという2つの革新的なモデルを紹介します。食品コンピューティングにおけるデータの質と可用性に関連する問題を軽減するために、多様で包括的な成分行のリポジトリであるARTIデータセットを導入します。さらに、エンティティ位置と予測の間に広がる一般的な課題—虚偽の相関関係を特定し、対処します。これに対処するために、食品NER専用のデータ拡張ルールのセットを提案します。ARTIデータセットと改訂されたTASTEsetデータセットで実施した広範な評価は、私たちのモデルの性能を強調しています。これらは、いくつかの最先端のベンチマークを上回り、BERTモデルと競争しながらも、パラメータサイズが小さく、トレーニング時間が短縮されます。

Read Full Paperexternally

AIに質問

Bookmark

View Full Paper