常に進化する食品コンピューティングの領域において、固有表現認識(NER)はレシピにおける単なる単語タグ付けを超えた変革的な可能性を示しています。その影響には、知的なレシピ推奨、健康分析、パーソナライズが含まれます。しかし、食品コンピューティングにおける既存のNERモデルは、レシピ入力標準の変動、限られた注釈、データセットの質などから生じる課題に直面しています。本稿では、成分NERの特定の問題に取り組み、効率的で堅牢なモデルSINERAと、タグ付けされていない成分リストエントリから学習するガウス混合モデル(GMM)を利用した半教師ありバリアントSINERASという2つの革新的なモデルを紹介します。食品コンピューティングにおけるデータの質と可用性に関連する問題を軽減するために、多様で包括的な成分行のリポジトリであるARTIデータセットを導入します。さらに、エンティティ位置と予測の間に広がる一般的な課題—虚偽の相関関係を特定し、対処します。これに対処するために、食品NER専用のデータ拡張ルールのセットを提案します。ARTIデータセットと改訂されたTASTEsetデータセットで実施した広範な評価は、私たちのモデルの性能を強調しています。これらは、いくつかの最先端のベンチマークを上回り、BERTモデルと競争しながらも、パラメータサイズが小さく、トレーニング時間が短縮されます。
Akujuobi et al. (Sat,)がこの問題を研究しました。
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: